Я ищу код C/C++ для VAD (обнаружение голосовой активности).
По сути, мое приложение считывает кадры PCM с устройства. Я хотел бы знать, когда пользователь разговаривает. Я не ищу какой-либо алгоритм распознавания речи, а только для обнаружения голоса.
Мне хотелось бы знать, когда пользователь говорит и когда он заканчивает:
Я ищу код C/C++ для VAD (обнаружение голосовой активности).
По сути, мое приложение считывает кадры PCM с устройства. Я хотел бы знать, когда пользователь разговаривает. Я не ищу какой-либо алгоритм распознавания речи, а только для обнаружения голоса.
Мне хотелось бы знать, когда пользователь говорит и когда он заканчивает:
Когда я использую Silero-Vad, чтобы уменьшить шум для моей модели быстрого, он сообщает об ошибке как удар:
---------------------------------------------------------------------------
ImportError Traceback (most recent call last)
File...
Когда я использую Silero-Vad, чтобы уменьшить шум для моей модели с более быстрым, он сообщает о ошибке ниже:
---------------------------------------------------------------------------
ImportError Traceback (most recent call last)
File...
Когда я использую Silero-Vad, чтобы уменьшить шум для моей модели с более быстрым, он сообщает о ошибке ниже:
---------------------------------------------------------------------------
ImportError Traceback (most recent call last)
File...
Я использую C# .NET 8, чтобы попытаться реализовать простой и интуитивно понятный BackgroundService, который запускается через событие, а не по таймеру, и который ограничивает работу одним потоком. Я собрал несколько источников и пришел к такому...