PicoVoice: получить доступ к аудиоданным Porcupine / PvRecorder, извлечь громкость/аудиоданные? - Цифровое Кемерово

PicoVoice: получить доступ к аудиоданным Porcupine / PvRecorder, извлечь громкость/аудиоданные? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

PicoVoice: получить доступ к аудиоданным Porcupine / PvRecorder, извлечь громкость/аудиоданные?

Цитата

Сообщение Anonymous » 09 янв 2025, 21:39

tl;dr: Есть ли какие-нибудь базовые аудиоданные, которые я могу извлечь из PvRecorder, а именно громкость?
У меня есть приложение на Python, которое поддерживает голосовое управление. Технология распознавания, и я использую Porcupine от PicoVoice для пробуждения, и она работает ОЧЕНЬ хорошо, и я очень доволен их продуктом. Мое приложение использует семафор для совместного использования микрофона между моим слушателем и Porcupine, и это нормально.
Но мне часто приходится «не давать» PicoVoice собирать аудиоданные, чтобы позволить моему собственный прослушиватель для получения аудиоданных (а именно громкости). Это действительно похоже на трату совершенно хороших аудиоданных - и, конечно, создает возможное окно пропуска слова пробуждения.
В моем коде есть вызовы к этим двум объектам (очевидно, я создаю сначала их, предупреждая гуглеров: приведенный ниже код не действителен):

Код: Выделить всё

pvrRead = (PvRecorder).read()
result = (pvporcupine).process(pvrRead)

И мне интересно, есть ли какие-либо аудиоданные, которые я могу извлечь из данных «pvrRead», которые записывает Porcupine или PvRecorder — опять же, а именно громкость.
Было бы *потрясающе*, если бы я мог преобразовать аудиоданные «pvrRead» в аудиоформат, который можно было бы использовать с Speech_recognition в Python, но я предполагаю, что это не так. возможно.
Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/793 ... audio-data

1736447989

Anonymous

[b]tl;dr: Есть ли какие-нибудь базовые аудиоданные, которые я могу извлечь из PvRecorder, а именно громкость?[/b]
У меня есть приложение на Python, которое поддерживает голосовое управление. Технология распознавания, и я использую Porcupine от PicoVoice для пробуждения, и она работает ОЧЕНЬ хорошо, и я очень доволен их продуктом.  Мое приложение использует семафор для совместного использования микрофона между моим слушателем и Porcupine, и это нормально.
Но мне часто приходится «не давать» PicoVoice собирать аудиоданные, чтобы позволить моему  собственный прослушиватель для получения аудиоданных (а именно громкости).  Это действительно похоже на трату совершенно хороших аудиоданных - и, конечно, создает возможное окно пропуска слова пробуждения.
В моем коде есть вызовы к этим двум объектам (очевидно, я создаю сначала их, предупреждая гуглеров: приведенный ниже код [b]не[/b] действителен):
[code]pvrRead = (PvRecorder).read()
result = (pvporcupine).process(pvrRead)
[/code]
И мне интересно, есть ли какие-либо аудиоданные, которые я могу извлечь из данных «pvrRead», которые записывает Porcupine или PvRecorder — опять же, а именно громкость. 
Было бы *потрясающе*, если бы я мог преобразовать аудиоданные «pvrRead» в аудиоформат, который можно было бы использовать с Speech_recognition в Python, но я предполагаю, что это не так. возможно.
Спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/79343709/picovoice-access-porcupine-pvrecorder-audio-data-extract-volume-audio-data[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»