Я работаю над RPI 4 и получил код работал, но время прослушивания из моего микрофона моего объекта распознавания речи на самом деле почти как 10 секунд. Я хочу уменьшить на этот раз. Я посмотрел на документацию библиотеки распознавания речи, но в ней нигде не упоминается функция. /> < /blockquote>
Поэтому я попытался вызвать функцию как: < /p>
audio = r.listen(source,None,3)
< /code>
или < /p>
audio = r.listen(source,3,3)
< /code>
надеясь, что он будет прослушивать в течение 3 секунд, но это не работает так.import speech_recognition as sr
r = sr.Recognizer()
speech = sr.Microphone(2)
#print(sr.Microphone.list_microphone_names())
while 1:
with speech as source:
print("say something!…")
audio = r.adjust_for_ambient_noise(source)
audio = r.listen(source,None,3)
print("the audio has been recorded")
# Speech recognition using Google Speech Recognition
try:
print("api is enabled")
recog = r.recognize_google(audio, language = 'en-US')
# for testing purposes, we're just using the default API key
# to use another API key, use r.recognize_google(audio)
# instead of r.recognize_google(audio)
print("You said: " + recog)
except sr.UnknownValueError:
print("Google Speech Recognition could not understand audio")
except sr.RequestError as e:
print("Could not request results from Google Speech Recognition service; {0}".format(e))
Как мне уменьшить продолжительность прослушивания?
Я работаю над RPI 4 и получил код работал, но время прослушивания из моего микрофона моего объекта распознавания речи на самом деле почти как 10 секунд. Я хочу уменьшить на этот раз. Я посмотрел на документацию библиотеки распознавания речи, но в ней нигде не упоминается функция. /> < /blockquote> Поэтому я попытался вызвать функцию как: < /p> [code]audio = r.listen(source,None,3) < /code> или < /p> audio = r.listen(source,3,3) < /code> надеясь, что он будет прослушивать в течение 3 секунд, но это не работает так.import speech_recognition as sr
r = sr.Recognizer()
speech = sr.Microphone(2)
#print(sr.Microphone.list_microphone_names())
while 1:
with speech as source: print("say something!…") audio = r.adjust_for_ambient_noise(source) audio = r.listen(source,None,3) print("the audio has been recorded") # Speech recognition using Google Speech Recognition try: print("api is enabled") recog = r.recognize_google(audio, language = 'en-US') # for testing purposes, we're just using the default API key # to use another API key, use r.recognize_google(audio) # instead of r.recognize_google(audio)
print("You said: " + recog) except sr.UnknownValueError: print("Google Speech Recognition could not understand audio") except sr.RequestError as e: print("Could not request results from Google Speech Recognition service; {0}".format(e)) [/code] [b] Как мне уменьшить продолжительность прослушивания? [/b]
Я хочу создать модель распознавания речи с нуля без использования существующей модели. Я уже успешно использовал Whisper, но мне нужно создать модель, которую я могу тренировать себя, чья производительность может быть измерена против шепота. Я даже...
Я работаю над функциональностью, которую можно будет подключить к веб-видеоплееру, в данном случае JW Player, где пользователь выбирает язык, и звук будет обрабатываться с помощью моего специального API перевода 1.) Преобразование речи в текст и 2.)...
Мне нужно распознавание речи, поэтому API речи Java кажется довольно хорошим решением моей проблемы с поиском подходящего API. Я попробовал API Sphinx-4, но не смог найти никаких JAR-файлов в загруженном мной пакете PreAlpha.zip. Я смог найти только...
У меня есть код для распознавания речи, теперь я хочу добавить фразу «Стоп», поэтому единственный способ остановить — это выполнить многопроцессорную обработку со сбитыми процессами. код большой, но проблема в этих функциях: '
Could you please provide guidance on integrating two Python programs? One program utilizes a speech recognition model for whispering, while the other converts text into a G-code file for a handcode application. My aim is to merge these programs so...