Печатайте точные промежуточные слова в реальном времени из Google Stt

Печатайте точные промежуточные слова в реальном времени из Google Stt ⇐ C#

1 сообщение • Страница 1 из 1

Anonymous

Печатайте точные промежуточные слова в реальном времени из Google Stt

Цитата

Сообщение Anonymous » 07 ноя 2023, 09:05

Как распечатать текст произнесенных слов в реальном времени из Google Stt. Мы можем увидеть это в голосовом поиске Google, если даём команду типа «переполнение стека», он мгновенно печатает слова. У меня есть код ниже -

static async Task Main(string[] args) { строка учетные данныеPath = "C:/Users/Bjit/Downloads/isocial-398406-4b944a65c2f1/isocial-398406-4b944a65c2f1.json"; System.Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", CredentialPath); строка LanguageCode = "en-US"; вар SpeechClient = SpeechClient.Create(); // Инициализируем входной аудиопоток вар audioStream = новый WaveInEvent (); audioStream.WaveFormat = новый WaveFormat(16000, 16, 1); // При необходимости корректируем формат варstreamingCall = речьКлиент.StreamingRecnigne(); // Начать потоковую передачу с конфигурацией varstreamingConfig = новый StreamingRecognitionConfig { Конфигурация = новая конфигурация распознавания { Кодировка = RecognitionConfig.Types.AudioEncoding.Linear16, СэмплРатеГерц = 16000, Код Языка = Код Языка, EnableAutomaticPunctuation = true, // Включить пунктуацию }, InterimResults = true, // Включить промежуточные результаты }; streamingCall.WriteAsync(новый StreamingRecounceRequest { StreamingConfig = потоковая конфигурация, }); вар interimResultBuilder = новый StringBuilder(); строка LastInterimResult = string.Empty; // Обработка аудиоданных audioStream.DataAvailable += (s, e) => { если (e.Buffer.Length > 0) { streamingCall.WriteAsync(новый StreamingRecounceRequest { AudioContent = Google.Protobuf.ByteString.CopyFrom(e.Buffer, 0, e.BytesRecorded), }); } }; audioStream.StartRecording(); Console.WriteLine("Прослушивание..."); // Запускаем новый поток для прослушивания ответов от сервера вар responseThread = новый поток (async () => { ожидайте foreach (ответ var вstreamingCall.GetResponseStream()) { foreach (результат var в ответе.Результаты) { строковая расшифровка = result.Alternatives[0].Transcript; если (result.IsFinal) { Console.WriteLine(расшифровка); промежуточныйResultBuilder.Очистить(); } иначе, если (IsSignificantChange(расшифровка, LastInterimResult)) { interimResultBuilder.Append(расшифровка); // Разделение промежуточных результатов на полные предложения на основе знаков препинания var interimSentences = interimResultBuilder.ToString().Split(". ", StringSplitOptions.RemoveEmptyEntries); foreach (варное предложение в промежуточных предложениях) { Console.WriteLine("Промежуточный результат: " + предложение + "."); } промежуточныйResultBuilder.Очистить(); } LastInterimResult = стенограмма; } } }); ответПоток.Начать(); Console.WriteLine("Нажмите Enter, чтобы остановить запись..."); Консоль.ReadLine(); // Остановка записи звука и завершение потокового вызова audioStream.StopRecording(); потоковый вызов.WriteCompleteAsync(); ответПоток.Присоединиться(); Console.WriteLine("Нажмите любую клавишу, чтобы выйти..."); Консоль.ReadKey(); } static bool IsSignificantChange (строка currentInterimResult, строка LastInterimResult) { // Настройте эту функцию, чтобы определить, что представляет собой существенное изменение // Здесь мы проверяем, отличается ли текущий результат от последнего результата. return !string.Equals(currentInterimResult, LastInterimResult, StringComparison.OrdinalIgnoreCase); } В качестве вывода речи — здравствуйте, доброе утро, результаты показаны ниже: Промежуточный итог: как. Промежуточный результат: ад. Промежуточный результат: Здравствуйте.. Промежуточный результат: здравствуйте. Промежуточный результат: Здравствуйте. Промежуточный результат: Доброе утро.. Промежуточный результат: Здравствуйте.. Промежуточный результат: Доброе утро.. Промежуточный результат: Здравствуйте. Промежуточный результат: Доброе утро.. Привет. Доброе утро.

Но мой ожидаемый результат печати текста такой же, как при голосовом поиске Google. Когда я говорю «привет», он мгновенно печатает «привет», если я говорю «хорошо», он мгновенно печатает «хорошо», не передавая никаких необычных слов. конечный результат отображается правильно и без каких-либо проблем. Спасибо.

Здесь использовался Google STT, NAudio.

1699337152

Anonymous


Как распечатать текст произнесенных слов в реальном времени из Google Stt. Мы можем увидеть это в голосовом поиске Google, если даём команду типа «переполнение стека», он мгновенно печатает слова. У меня есть код ниже -
 
static async Task Main(string[] args) {     строка учетные данныеPath = "C:/Users/Bjit/Downloads/isocial-398406-4b944a65c2f1/isocial-398406-4b944a65c2f1.json";     System.Environment.SetEnvironmentVariable("GOOGLE_APPLICATION_CREDENTIALS", CredentialPath);     строка LanguageCode = "en-US";     вар SpeechClient = SpeechClient.Create();     // Инициализируем входной аудиопоток     вар audioStream = новый WaveInEvent ();     audioStream.WaveFormat = новый WaveFormat(16000, 16, 1); // При необходимости корректируем формат     варstreamingCall = речьКлиент.StreamingRecnigne();     // Начать потоковую передачу с конфигурацией     varstreamingConfig = новый StreamingRecognitionConfig     {         Конфигурация = новая конфигурация распознавания         {             Кодировка = RecognitionConfig.Types.AudioEncoding.Linear16,             СэмплРатеГерц = 16000,             Код Языка = Код Языка,             EnableAutomaticPunctuation = true, // Включить пунктуацию         },         InterimResults = true, // Включить промежуточные результаты     };     streamingCall.WriteAsync(новый StreamingRecounceRequest     {         StreamingConfig = потоковая конфигурация,     });     вар interimResultBuilder = новый StringBuilder();     строка LastInterimResult = string.Empty;     // Обработка аудиоданных     audioStream.DataAvailable += (s, e) =>     {         если (e.Buffer.Length > 0)         {             streamingCall.WriteAsync(новый StreamingRecounceRequest             {                 AudioContent = Google.Protobuf.ByteString.CopyFrom(e.Buffer, 0, e.BytesRecorded),             });         }     };     audioStream.StartRecording();     Console.WriteLine("Прослушивание...");     // Запускаем новый поток для прослушивания ответов от сервера     вар responseThread = новый поток (async () =>     {         ожидайте foreach (ответ var вstreamingCall.GetResponseStream())         {             foreach (результат var в ответе.Результаты)             {                 строковая расшифровка = result.Alternatives[0].Transcript;                 если (result.IsFinal)                 {                     Console.WriteLine(расшифровка);                     промежуточныйResultBuilder.Очистить();                 }                 иначе, если (IsSignificantChange(расшифровка, LastInterimResult))                 {                     interimResultBuilder.Append(расшифровка);                     // Разделение промежуточных результатов на полные предложения на основе знаков препинания                     var interimSentences = interimResultBuilder.ToString().Split(". ", StringSplitOptions.RemoveEmptyEntries);                     foreach (варное предложение в промежуточных предложениях)                     {                         Console.WriteLine("Промежуточный результат: " + предложение + ".");                     }                     промежуточныйResultBuilder.Очистить();                 }                 LastInterimResult = стенограмма;             }         }     });     ответПоток.Начать();     Console.WriteLine("Нажмите Enter, чтобы остановить запись...");     Консоль.ReadLine();     // Остановка записи звука и завершение потокового вызова     audioStream.StopRecording();     потоковый вызов.WriteCompleteAsync();     ответПоток.Присоединиться();     Console.WriteLine("Нажмите любую клавишу, чтобы выйти...");     Консоль.ReadKey(); } static bool IsSignificantChange (строка currentInterimResult, строка LastInterimResult) {     // Настройте эту функцию, чтобы определить, что представляет собой существенное изменение     // Здесь мы проверяем, отличается ли текущий результат от последнего результата.     return !string.Equals(currentInterimResult, LastInterimResult, StringComparison.OrdinalIgnoreCase); }  В качестве вывода речи — здравствуйте, доброе утро, результаты показаны ниже: Промежуточный итог: как. Промежуточный результат: ад. Промежуточный результат: Здравствуйте.. Промежуточный результат: здравствуйте. Промежуточный результат: Здравствуйте. Промежуточный результат: Доброе утро.. Промежуточный результат: Здравствуйте.. Промежуточный результат: Доброе утро.. Промежуточный результат: Здравствуйте. Промежуточный результат: Доброе утро.. Привет. Доброе утро.
 
Но мой ожидаемый результат печати текста такой же, как при голосовом поиске Google. Когда я говорю «привет», он мгновенно печатает «привет», если я говорю «хорошо», он мгновенно печатает «хорошо», не передавая никаких необычных слов. конечный результат отображается правильно и без каких-либо проблем. Спасибо.
 
Здесь использовался Google STT, NAudio.

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

En-IN Потоковая транскрипция не работает в Google STT

Последнее сообщение Anonymous « 15 июл 2024, 08:37
Добавлено в форуме Python

Anonymous » 15 июл 2024, 08:37 » в форуме Python

Я использую облачные сервисы Google для транскрипции звука, поступающего через микрофон. Я создал распознаватель с параметрами: global=Long=en-In. Во время тестирования он даже не возвращает ни одной транскрипции или слова! Но с другим...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
15 июл 2024, 08:37
Я столкнулся с трудностями при разработке приложения, которое объединяет видеоконференции и STT (преобразование речи в т

Последнее сообщение Anonymous « 24 май 2024, 05:19
Добавлено в форуме Android

Anonymous » 24 май 2024, 05:19 » в форуме Android

В настоящее время я разрабатываю приложение, которое интегрирует видеоконференции (с использованием jitsiMeetSDK) и STT (с использованием @react-native-voice/voice) с React Native.
Я столкнулся с проблемой на Android, когда при подключен к...

0 Ответы

51 Просмотры

Последнее сообщение Anonymous
24 май 2024, 05:19
Как удалить накладную STT -коробку из API речевого режизализатора в Android Studio?

Последнее сообщение Anonymous « 06 сен 2025, 11:09
Добавлено в форуме Android

Anonymous » 06 сен 2025, 11:09 » в форуме Android

При создании приложения STT в Android Studio (JetPack Compose) я столкнулся с этим в распознаванице речи, когда запускаю приложение:
stt в приложении
Я хочу удалить это, чтобы пользовательский интерфейс выглядел более чистым. Есть ли способ сделать...

0 Ответы

0 Просмотры

Последнее сообщение Anonymous
06 сен 2025, 11:09
Для и фолских петли печатайте несколько результатов

Последнее сообщение Anonymous « 14 фев 2025, 02:16
Добавлено в форуме Php

Anonymous » 14 фев 2025, 02:16 » в форуме Php

Это результат, который я хочу:

January 2018
Division A
Division B
Division C

February 2018
Division A
Division B
Division C

..so on..

В контроллере это код:

$i = 0;
for ($dd = $start_date; $dd division_model->get_divisions();
}

Обычно он...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
14 фев 2025, 02:16
Скрипт Python с input () и print () не печатайте при запуске из метода класса PowerShell

Последнее сообщение Anonymous « 30 апр 2025, 19:07
Добавлено в форуме Python

Anonymous » 30 апр 2025, 19:07 » в форуме Python

Этот рассматриваемый скрипт работает, как и ожидалось от PowerShell :
# scripts.py
x = input( type your input: )
print(f your input is: {x} )

Но как только вы оберните его в модуль:
class CSV{
$pythonScript

CSV( $pythonPath){...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
30 апр 2025, 19:07

Вернуться в «C#»