refac

2025-04-07 22:25:05 +00:00 · 2024-09-19 02:40:54 +02:00 · 2024-09-19 02:40:54 +02:00 · afa42dd2e4
commit afa42dd2e4
parent 4d9677e808
2 changed files with 100 additions and 97 deletions
--- a/backend/open_webui/apps/audio/main.py
+++ b/backend/open_webui/apps/audio/main.py
@ -161,7 +161,9 @@ async def update_audio_config(
    app.state.config.TTS_VOICE = form_data.tts.VOICE
    app.state.config.TTS_SPLIT_ON = form_data.tts.SPLIT_ON
    app.state.config.TTS_AZURE_SPEECH_REGION = form_data.tts.AZURE_SPEECH_REGION
-    app.state.config.TTS_AZURE_SPEECH_OUTPUT_FORMAT = form_data.tts.AZURE_SPEECH_OUTPUT_FORMAT
+    app.state.config.TTS_AZURE_SPEECH_OUTPUT_FORMAT = (
        form_data.tts.AZURE_SPEECH_OUTPUT_FORMAT
    )
    app.state.config.STT_OPENAI_API_BASE_URL = form_data.stt.OPENAI_API_BASE_URL
    app.state.config.STT_OPENAI_API_KEY = form_data.stt.OPENAI_API_KEY
@ -314,7 +316,7 @@ async def speech(request: Request, user=Depends(get_verified_user)):
                detail=error_detail,
            )
-    elif app.state.config.TTS_ENGINE == "azurespeechservice":
+    elif app.state.config.TTS_ENGINE == "azure":
        payload = None
        try:
            payload = json.loads(body.decode("utf-8"))
@ -329,9 +331,9 @@ async def speech(request: Request, user=Depends(get_verified_user)):
        url = f"https://{region}.tts.speech.microsoft.com/cognitiveservices/v1"
        headers = {
-            'Ocp-Apim-Subscription-Key': app.state.config.TTS_API_KEY,
+            "Ocp-Apim-Subscription-Key": app.state.config.TTS_API_KEY,
-            'Content-Type': 'application/ssml+xml',
+            "Content-Type": "application/ssml+xml",
-            'X-Microsoft-OutputFormat': output_format
+            "X-Microsoft-OutputFormat": output_format,
        }
        data = f"""<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="{locale}">
@ -347,9 +349,8 @@ async def speech(request: Request, user=Depends(get_verified_user)):
        else:
            log.error(f"Error synthesizing speech - {response.reason}")
            raise HTTPException(
-                status_code=500,
+                status_code=500, detail=f"Error synthesizing speech - {response.reason}"
-                detail=f"Error synthesizing speech - {response.reason}")
+            )
@app.post("/transcriptions")
@ -528,23 +529,22 @@ def get_available_voices() -> dict:
        except Exception:
            # Avoided @lru_cache with exception
            pass
-    elif app.state.config.TTS_ENGINE == "azurespeechservice":
+    elif app.state.config.TTS_ENGINE == "azure":
        try:
            region = app.state.config.TTS_AZURE_SPEECH_REGION
            url = f"https://{region}.tts.speech.microsoft.com/cognitiveservices/voices/list"
-            headers = {
+            headers = {"Ocp-Apim-Subscription-Key": app.state.config.TTS_API_KEY}
                'Ocp-Apim-Subscription-Key': app.state.config.TTS_API_KEY
            }
            response = requests.get(url, headers=headers)
            response.raise_for_status()
            voices = response.json()
            for voice in voices:
-                ret[voice['ShortName']] = f"{voice['DisplayName']} ({voice['ShortName']})"
+                ret[voice["ShortName"]] = (
                    f"{voice['DisplayName']} ({voice['ShortName']})"
                )
        except requests.RequestException as e:
            log.error(f"Error fetching voices: {str(e)}")
    return ret
--- a/src/lib/components/admin/Settings/Audio.svelte
+++ b/src/lib/components/admin/Settings/Audio.svelte
@ -91,7 +91,7 @@
 				VOICE: TTS_VOICE,
 				SPLIT_ON: TTS_SPLIT_ON,
 				AZURE_SPEECH_REGION: TTS_AZURE_SPEECH_REGION,
-				AZURE_SPEECH_OUTPUT_FORMAT: TTS_AZURE_SPEECH_OUTPUT_FORMAT,
+				AZURE_SPEECH_OUTPUT_FORMAT: TTS_AZURE_SPEECH_OUTPUT_FORMAT
 			},
 			stt: {
 				OPENAI_API_BASE_URL: STT_OPENAI_API_BASE_URL,
@ -231,7 +231,7 @@
 							<option value="">{$i18n.t('Web API')}</option>
 							<option value="openai">{$i18n.t('OpenAI')}</option>
 							<option value="elevenlabs">{$i18n.t('ElevenLabs')}</option>
-							<option value="azurespeechservice">{$i18n.t('Azure Speech service')}</option>
+							<option value="azure">{$i18n.t('Azure AI Speech')}</option>
 						</select>
 					</div>
 				</div>
@ -260,7 +260,7 @@
 							/>
 						</div>
 					</div>
-				{:else if TTS_ENGINE === 'azurespeechservice'}
+				{:else if TTS_ENGINE === 'azure'}
 					<div>
 						<div class="mt-1 flex gap-2 mb-1">
 							<input
@ -384,7 +384,7 @@
 							</div>
 						</div>
 					</div>
-					{:else if TTS_ENGINE === 'azurespeechservice'}
+				{:else if TTS_ENGINE === 'azure'}
 					<div class=" flex gap-2">
 						<div class="w-full">
 							<div class=" mb-1.5 text-sm font-medium">{$i18n.t('TTS Voice')}</div>
@ -408,7 +408,10 @@
 						<div class="w-full">
 							<div class=" mb-1.5 text-sm font-medium">
 								{$i18n.t('Output format')}
-									<a href="https://learn.microsoft.com/en-us/azure/ai-services/speech-service/rest-text-to-speech?tabs=streaming#audio-outputs" target="_blank" >
+								<a
 									href="https://learn.microsoft.com/en-us/azure/ai-services/speech-service/rest-text-to-speech?tabs=streaming#audio-outputs"
 									target="_blank"
 								>
 									<small>{$i18n.t('Available list')}</small>
 								</a>
 							</div>