У меня есть приложение на Python, которое поддерживает голосовое управление. Технология распознавания, и я использую Porcupine от PicoVoice для пробуждения, и она работает ОЧЕНЬ хорошо, и я очень доволен их продуктом. Мое приложение использует семафор для совместного использования микрофона между моим слушателем и Porcupine, и это нормально.
Но мне часто приходится «не давать» PicoVoice собирать аудиоданные, чтобы позволить моему собственный прослушиватель для получения аудиоданных (а именно громкости). Это действительно похоже на трату совершенно хороших аудиоданных - и, конечно, создает возможное окно пропуска слова пробуждения.
В моем коде есть вызовы к этим двум объектам (очевидно, я создаю сначала их, предупреждая гуглеров: приведенный ниже код не действителен):
Код: Выделить всё
pvrRead = (PvRecorder).read()
result = (pvporcupine).process(pvrRead)
Было бы *потрясающе*, если бы я мог преобразовать аудиоданные «pvrRead» в аудиоформат, который можно было бы использовать с Speech_recognition в Python, но я предполагаю, что это не так. возможно.
Спасибо!
Подробнее здесь: https://stackoverflow.com/questions/793 ... audio-data