Задача: создать прерываемый голосовой помощник с искусственным интеллектомPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Задача: создать прерываемый голосовой помощник с искусственным интеллектом

Сообщение Anonymous »

В настоящее время я создаю AI Voice Assistant на Python, решение довольно простое.
  • Я использую Speech_recognition для перевода речи в текст
    Затем текст отправляется в OpenAI API.
  • OpenAI возвращает ответ.
  • Текст затем синтезируется в речь с помощью AWS Polly. или Azure Cognitive Speech
Проблема, с которой я столкнулся, заключается в том, что я хочу, чтобы работу этого голосового помощника можно было прерывать. Например, когда помощник говорит, а пользователь говорит поверх него, помощник должен иметь возможность услышать новый ввод, прекратить говорить и ответить на новый ввод.
Однако в этом заключаются проблемы. Я сталкиваюсь:
  • Когда я включаю прерывание голосового помощника. И я играю в это на Macbook Pro, он слышит свой голос и начинает реагировать на свой голос.
  • Я использую такие методы, как обнаружение голосовой активности (VAD) или Speechbrain, чтобы различать между голосом голосового помощника и голосом пользователя, или анализом частоты звука, или сравнением на основе буфера, чтобы различать голос пользователя и голос помощника.... чтобы голосовой помощник не реагировал на свой собственный голос. Однако тут получается очень запутанная ситуация, когда Голосовой помощник говорит, становится очень сложно отличить свой голос от моего.
Суть Решение заключается в том, что оно доступно через браузер, так что пользователь может взаимодействовать с голосовым помощником через браузер мобильного устройства или настольного компьютера.
Поскольку я создаю это как прототип, я использование Streamlit в Python для части веб-приложения.
Сталкивался ли кто-нибудь с такой проблемой и как вы смогли ее решить? Заранее спасибо.

Подробнее здесь: https://stackoverflow.com/questions/792 ... -assistant
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»