Преобразование речи в текст Google дублирует сообщения

Преобразование речи в текст Google дублирует сообщения ⇐ Python

1 сообщение • Страница 1 из 1

Гость

Преобразование речи в текст Google дублирует сообщения

Цитата

Сообщение Гость » 24 сен 2023, 11:21

Я отправляю mp3-файл в Google. Файл представляет собой стереозапись телефонного разговора с одним абонентом на каждом канале. Проблема в том, что все сказанное дублируется и присваивается обоим каналам.

def transcribe_file_with_multichannel(speech_file: str, client_file) -> речь.RecowleResponse: """Расшифровать данный аудиофайл синхронно с многоканальный. Аргументы: речевой_файл: путь к распознаваемому аудиофайлу. Возврат: Результаты RecounceResponse. """ учетные данные = service_account.Credentials.from_service_account_file(client_file) клиент = речь.SpeechClient(учетные данные=учетные данные) с open(speech_file, "rb") как audio_file: содержимое = audio_file.read() аудио = речь.RecognitionAudio(content=content) конфигурация = речь.RecognitionConfig( кодирование = речь.RecognitionConfig.AudioEncoding.MP3, sample_rate_hertz=44100, Language_code="en-US", audio_channel_count=2, Enable_separate_recognition_per_channel = Верно, ) операция = client.long_running_recouncee(config=config, audio=audio) print("Ожидание завершения операции...") ответ = операция.результат(таймаут=90) печать(ответ.результаты) для i результат enumerate(response.results): альтернатива = result.alternatives[0] печать("-" * 20) print(f"Первая альтернатива результата {i}") print(f"Расшифровка: {alternative.transcript}") print(f"Тег канала: {result.channel_tag}") вернуть результат Пример ответа:

альтернативы { стенограмма: «Если вы запросили этот звонок, скажите «да»» достоверность: 0,987629 } тег_канала: 1 result_end_time { секунд: 12 нанос: 470000000 } Language_code: "en-us" , альтернативы { стенограмма: «Если вы запросили этот звонок, пожалуйста, скажите да, да» уверенность: 0,984083593 } тег_канала: 2 result_end_time { секунд: 13 нанос: 890000000 Я не знаю, что попробовать на этом этапе.

1695543708

Гость


Я отправляю mp3-файл в Google. Файл представляет собой стереозапись телефонного разговора с одним абонентом на каждом канале. Проблема в том, что все сказанное дублируется и присваивается обоим каналам.
 
def transcribe_file_with_multichannel(speech_file: str, client_file) -> речь.RecowleResponse:     """Расшифровать данный аудиофайл синхронно с     многоканальный.     Аргументы:         речевой_файл: путь к распознаваемому аудиофайлу.     Возврат:         Результаты RecounceResponse.     """     учетные данные = service_account.Credentials.from_service_account_file(client_file)     клиент = речь.SpeechClient(учетные данные=учетные данные)     с open(speech_file, "rb") как audio_file:         содержимое = audio_file.read()     аудио = речь.RecognitionAudio(content=content)     конфигурация = речь.RecognitionConfig(         кодирование = речь.RecognitionConfig.AudioEncoding.MP3,         sample_rate_hertz=44100,         Language_code="en-US",         audio_channel_count=2,         Enable_separate_recognition_per_channel = Верно,     )     операция = client.long_running_recouncee(config=config, audio=audio)     print("Ожидание завершения операции...")     ответ = операция.результат(таймаут=90)     печать(ответ.результаты)     для i результат enumerate(response.results):         альтернатива = result.alternatives[0]         печать("-" * 20)         print(f"Первая альтернатива результата {i}")         print(f"Расшифровка: {alternative.transcript}")         print(f"Тег канала: {result.channel_tag}")     вернуть результат  Пример ответа:
 
альтернативы {   стенограмма: «Если вы запросили этот звонок, скажите «да»»   достоверность: 0,987629 } тег_канала: 1 result_end_time {   секунд: 12   нанос: 470000000 } Language_code: "en-us" , альтернативы {   стенограмма: «Если вы запросили этот звонок, пожалуйста, скажите да, да»   уверенность: 0,984083593 } тег_канала: 2 result_end_time {   секунд: 13   нанос: 890000000  Я не знаю, что попробовать на этом этапе.

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Преобразование речи в текст, API речи Java, где его найти?

Последнее сообщение Anonymous « 23 окт 2024, 16:17
Добавлено в форуме JAVA

Anonymous » 23 окт 2024, 16:17 » в форуме JAVA

Мне нужно распознавание речи, поэтому API речи Java кажется довольно хорошим решением моей проблемы с поиском подходящего API. Я попробовал API Sphinx-4, но не смог найти никаких JAR-файлов в загруженном мной пакете PreAlpha.zip. Я смог найти только...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
23 окт 2024, 16:17
Проблема преобразования речи в текст и речи в веб-плеере

Последнее сообщение Гость « 19 сен 2023, 19:16
Добавлено в форуме Javascript

Гость » 19 сен 2023, 19:16 » в форуме Javascript

Я работаю над функциональностью, которую можно будет подключить к веб-видеоплееру, в данном случае JW Player, где пользователь выбирает язык, и звук будет обрабатываться с помощью моего специального API перевода 1.) Преобразование речи в текст и 2.)...

0 Ответы

139 Просмотры

Последнее сообщение Гость
19 сен 2023, 19:16
Преобразование речи Azure в текст в контейнере --> Speechsdk.transcription.ConversationTranscriber Ошибка при обновлении

Последнее сообщение Anonymous « 02 июл 2024, 18:30
Добавлено в форуме Python

Anonymous » 02 июл 2024, 18:30 » в форуме Python

Я использую Azure, контейнерную службу SpeechToText, локально в кластере openshift. Я использую последнюю версию: 4.7.0-amd64-fr-fr. С другой стороны, у меня есть небольшой API-интерфейс contenerized flask, который использует SDK Azure Cognitive...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 18:30
Преобразование речи Azure в текст в контейнере --> Speechsdk.transcription.ConversationTranscriber Ошибка при обновлении

Последнее сообщение Anonymous « 05 июл 2024, 06:18
Добавлено в форуме Python

Anonymous » 05 июл 2024, 06:18 » в форуме Python

Я использую Azure, контейнерную службу SpeechToText, локально в кластере openshift. Я использую последнюю версию: 4.7.0-amd64-fr-fr. С другой стороны, у меня есть небольшой API-интерфейс contenerized flask, который использует SDK Azure Cognitive...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
05 июл 2024, 06:18
Преобразование речи в текст и чистая архитектура в разработке под Android

Последнее сообщение Anonymous « 16 июл 2024, 17:05
Добавлено в форуме Android

Anonymous » 16 июл 2024, 17:05 » в форуме Android

Привет, я разрабатываю приложение для Android, которое будет получать голос пользователя, преобразовывать его в текст (с помощью любой службы преобразования речи в текст), а затем распечатывать распознанный текст на экране.
Итак, следует ли мне...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
16 июл 2024, 17:05

Вернуться в «Python»