Как распознать аудио, когда я предоставляю список из более чем 4 языков в Azure с помощью функции распознавания_once()? - Цифровое Кемерово

Как распознать аудио, когда я предоставляю список из более чем 4 языков в Azure с помощью функции распознавания_once()? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как распознать аудио, когда я предоставляю список из более чем 4 языков в Azure с помощью функции распознавания_once()?

Цитата

Сообщение Anonymous » 03 июл 2024, 06:33

У пакета SDK Azure Speech есть ограничение: он поддерживает обнаружение только до 4 языков одновременно в режиме «DetectAudioAtStart». Чтобы обойти это ограничение, я создаю пакеты из 4 языков из списка Languages_to_detect и пытаюсь определить язык для каждого пакета. Но он не может распознать и дает мне неправильный ответ. Я передаю аудиофайл на бангали, и там написано хинди. что неправильно. Ниже приведен код для справки:
import azure.cognitiveservices.speech as speechsdk

subscription_key = "00000000000000000000000000"
service_region = "westus"
audio_file_path = "C:\\yogesh_folder\\speech_bangla.wav"

# List of all languages to detect
languages_to_detect = ["en-US", "ml-IN", "ta-IN", "te-IN", "gu-IN", "kn-IN", "mr-IN", "pa-IN", "bn-IN", "hi-IN"]

# Configure speech recognition
speech_config = speechsdk.SpeechConfig(subscription=subscription_key, region=service_region)

# Audio configuration
audio_config = speechsdk.audio.AudioConfig(filename=audio_file_path)

# Initialize detected language
detected_language = None

# Iterate through batches of 4 languages
for i in range(0, len(languages_to_detect), 4):
# Slice the batch of languages
batch_languages = languages_to_detect[i:i+4]

# Configure auto-detection of source language for current batch
auto_detect_source_language_config = speechsdk.languageconfig.AutoDetectSourceLanguageConfig(
languages=batch_languages
)

# Create a speech recognizer instance for current batch
speech_recognizer = speechsdk.SpeechRecognizer(
speech_config=speech_config,
auto_detect_source_language_config=auto_detect_source_language_config,
audio_config=audio_config
)

# Perform recognition
print(f"Detecting speech in languages: {batch_languages}")
result = speech_recognizer.recognize_once()

# Check result
if result.reason == speechsdk.ResultReason.RecognizedSpeech:
detected_language = result.properties.get(speechsdk.PropertyId.SpeechServiceConnection_AutoDetectSourceLanguageResult)
print(f"Detected language: {detected_language}")
break # Exit loop if language is detected

# If no language is detected, provide feedback
if detected_language is None:
print("No language detected.")

Подробнее здесь: https://stackoverflow.com/questions/786 ... e-in-azure

Реклама

1719977587

Anonymous

У пакета SDK Azure Speech есть ограничение: он поддерживает обнаружение только до 4 языков одновременно в режиме «DetectAudioAtStart». Чтобы обойти это ограничение, я создаю пакеты из 4 языков из списка Languages_to_detect и пытаюсь определить язык для каждого пакета. Но он не может распознать и дает мне неправильный ответ. Я передаю аудиофайл на бангали, и там написано хинди. что неправильно. Ниже приведен код для справки:
import azure.cognitiveservices.speech as speechsdk

subscription_key = "00000000000000000000000000"
service_region = "westus"
audio_file_path = "C:\\yogesh_folder\\speech_bangla.wav"

# List of all languages to detect
languages_to_detect = ["en-US", "ml-IN", "ta-IN", "te-IN", "gu-IN", "kn-IN", "mr-IN", "pa-IN", "bn-IN", "hi-IN"]

# Configure speech recognition
speech_config = speechsdk.SpeechConfig(subscription=subscription_key, region=service_region)

# Audio configuration
audio_config = speechsdk.audio.AudioConfig(filename=audio_file_path)

# Initialize detected language
detected_language = None

# Iterate through batches of 4 languages
for i in range(0, len(languages_to_detect), 4):
# Slice the batch of languages
batch_languages = languages_to_detect[i:i+4]

# Configure auto-detection of source language for current batch
auto_detect_source_language_config = speechsdk.languageconfig.AutoDetectSourceLanguageConfig(
languages=batch_languages
)

# Create a speech recognizer instance for current batch
speech_recognizer = speechsdk.SpeechRecognizer(
speech_config=speech_config,
auto_detect_source_language_config=auto_detect_source_language_config,
audio_config=audio_config
)

# Perform recognition
print(f"Detecting speech in languages: {batch_languages}")
result = speech_recognizer.recognize_once()

# Check result
if result.reason == speechsdk.ResultReason.RecognizedSpeech:
detected_language = result.properties.get(speechsdk.PropertyId.SpeechServiceConnection_AutoDetectSourceLanguageResult)
print(f"Detected language: {detected_language}")
break  # Exit loop if language is detected

# If no language is detected, provide feedback
if detected_language is None:
print("No language detected.")
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78698804/how-to-recognize-an-audio-when-i-provide-a-list-of-more-than-4-language-in-azure[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как распознать аудио, когда я предоставляю список из более чем 4 языков в Azure с помощью функции распознавания_once()?

Последнее сообщение Anonymous « 02 июл 2024, 21:54
Добавлено в форуме Python

Anonymous » 02 июл 2024, 21:54 » в форуме Python

У пакета SDK Azure Speech есть ограничение: он поддерживает обнаружение только до 4 языков одновременно в режиме «DetectAudioAtStart». Чтобы обойти это ограничение, я создаю пакеты из 4 языков из списка Languages_to_detect и пытаюсь определить язык...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 21:54
Параметры при работе над аудио транскрипцией языков с низким разрешением с шепотом

Последнее сообщение Anonymous « 16 июн 2025, 19:19
Добавлено в форуме Python

Anonymous » 16 июн 2025, 19:19 » в форуме Python

Я работаю над инструментом аудио транскрипции для языка с низким разрешением (украинским), и результаты являются неудовлетворительными. Я понимаю, что выбор более крупной модели и тонкой настройки может решить мои проблемы, но в настоящее время у...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
16 июн 2025, 19:19
Параметры при работе над аудио транскрипцией языков с низким разрешением с шепотом

Последнее сообщение Anonymous « 17 июн 2025, 06:18
Добавлено в форуме Python

Anonymous » 17 июн 2025, 06:18 » в форуме Python

Я работаю над инструментом транскрипции аудио для языка с низким разрешением (украинский), и результаты являются неудовлетворительными. Я понимаю, что выбор более крупной модели и тонкой настройки может решить мои проблемы, но в настоящее время у...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
17 июн 2025, 06:18
Параметры при работе над аудио транскрипцией языков с низким разрешением с шепотом

Последнее сообщение Anonymous « 18 июл 2025, 19:30
Добавлено в форуме Python

Anonymous » 18 июл 2025, 19:30 » в форуме Python

Я работаю над инструментом транскрипции аудио для языка с низким разрешением (украинский), и результаты являются неудовлетворительными. Я понимаю, что выбор более крупной модели и тонкой настройки может решить мои проблемы, но в настоящее время у...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
18 июл 2025, 19:30
Параметры при работе над аудио транскрипцией языков с низким разрешением с шепотом

Последнее сообщение Anonymous « 25 июл 2025, 17:20
Добавлено в форуме Python

Anonymous » 25 июл 2025, 17:20 » в форуме Python

Я работаю над инструментом транскрипции аудио для языка с низким разрешением (украинский), и результаты являются неудовлетворительными. Я понимаю, что выбор более крупной модели и тонкой настройки может решить мои проблемы, но в настоящее время у...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
25 июл 2025, 17:20

Вернуться в «Python»

Programmiererforum