Делаем голосового помощника в Raspberry Pi

Делаем голосового помощника в Raspberry Pi ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Делаем голосового помощника в Raspberry Pi

Цитата

Сообщение Anonymous » 03 июл 2024, 09:47

Я пытаюсь создать небольшой школьный проект, в котором устанавливаю небольшого голосового помощника на Raspberry Pi 4 (с ОС Raspberry Pi), чтобы использовать его в качестве карты в своей школе, но каждый раз, когда я провожу тест, это просто не работает, и я еще недостаточно разбираюсь в кодировании, чтобы знать, где я терплю неудачу или допускаю ошибку, чтобы это работало.
Кстати, да, я знаю говорю по-испански как на родном языке, и да, я снова обратился к искусственному интеллекту, чтобы получить максимальную отдачу от кодирования.
Предполагается, что к Raspberry Pi подключен микрофон и динамики, потому что предполагается, что помощник чтобы ответить на голос.
Это код:

Код: Выделить всё

import os
import torch
from transformers import GPT2LMHeadModel, GPT2Tokenizer
import speech_recognition as sr
from gtts import gTTS
import tempfile
import subprocess

# Función para leer archivos de información
def read_info(file_path):
try:
with open(file_path, 'r', encoding='utf-8') as f:
return f.read().strip()
except FileNotFoundError:
return None

# Inicializar el reconocedor de voz
recognizer = sr.Recognizer()

# Función para obtener la entrada de voz y convertirla a texto
def recognize_speech_from_mic(recognizer, microphone):
with microphone as source:
recognizer.adjust_for_ambient_noise(source)
print("Estoy escuchando...")
audio = recognizer.listen(source)

try:
transcript = recognizer.recognize_google(audio, language='es-ES')
return transcript
except sr.RequestError:
print("API de reconocimiento de voz no disponible.")
except sr.UnknownValueError:
print("No se pudo entender el audio.")
return None

# Ruta a los archivos de información
info_dir = '/home/horaki/Ubicaciones_URP.txt'

# Inicializar el modelo y el tokenizador
model_name = 'gpt2'
tokenizer = GPT2Tokenizer.from_pretrained(model_name)
model = GPT2LMHeadModel.from_pretrained(model_name)

# Mover el modelo a la CPU
model.to('cpu')

# Configurar el micrófono
microphone = sr.Microphone()

while True:
print("Por favor, haz una pregunta sobre un lugar.")
question = recognize_speech_from_mic(recognizer, microphone)
if question:
print(f"Pregunta recibida: {question}")
# Buscar la información del lugar en los archivos
words = question.split()
lugar = words[-1].lower()
info_file = os.path.join(info_dir, f'{lugar}.txt')

# Leer la información
info = read_info(info_file)
if not info:
print(f"No se encontró información para {lugar}")
continue

# Crear el prompt con la información añadida
input_text = f"Información:\n{info}\n\nPregunta: {question}"

# Tokenizar el texto de entrada
input_ids = tokenizer.encode(input_text, return_tensors='pt')

# Generar texto
with torch.no_grad():
output = model.generate(input_ids, max_length=150, num_return_sequences=1)

# Decodificar y mostrar el texto generado
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print("\nRespuesta del modelo:\n")
print(generated_text)

# Convertir el texto generado a voz usando gTTS
tts = gTTS(generated_text, lang='es')
with tempfile.NamedTemporaryFile(delete=True) as fp:
tts.save(fp.name + ".mp3")
subprocess.run(['mpg321', fp.name + ".mp3"])
else:
print("No se recibió una pregunta válida.")

Я пробовал изменить файл .txt, заменить микрофон и динамики и прочитать весь код, но я недостаточно разбираюсь в нем, чтобы понять, где ошибка. Я надеюсь, что вы можете мне помочь. Было бы очень здорово.

Подробнее здесь: https://stackoverflow.com/questions/787 ... spberry-pi

1719989225

Anonymous

Я пытаюсь создать небольшой школьный проект, в котором устанавливаю небольшого голосового помощника на Raspberry Pi 4 (с ОС Raspberry Pi), чтобы использовать его в качестве карты в своей школе, но каждый раз, когда я провожу тест, это просто не работает, и я еще недостаточно разбираюсь в кодировании, чтобы знать, где я терплю неудачу или допускаю ошибку, чтобы это работало.
Кстати, да, я знаю говорю по-испански как на родном языке, и да, я снова обратился к искусственному интеллекту, чтобы получить максимальную отдачу от кодирования.
Предполагается, что к Raspberry Pi подключен микрофон и динамики, потому что предполагается, что помощник чтобы ответить на голос.
Это код:
[code]import os
import torch
from transformers import GPT2LMHeadModel, GPT2Tokenizer
import speech_recognition as sr
from gtts import gTTS
import tempfile
import subprocess

# Función para leer archivos de información
def read_info(file_path):
try:
with open(file_path, 'r', encoding='utf-8') as f:
return f.read().strip()
except FileNotFoundError:
return None

# Inicializar el reconocedor de voz
recognizer = sr.Recognizer()

# Función para obtener la entrada de voz y convertirla a texto
def recognize_speech_from_mic(recognizer, microphone):
with microphone as source:
recognizer.adjust_for_ambient_noise(source)
print("Estoy escuchando...")
audio = recognizer.listen(source)

try:
transcript = recognizer.recognize_google(audio, language='es-ES')
return transcript
except sr.RequestError:
print("API de reconocimiento de voz no disponible.")
except sr.UnknownValueError:
print("No se pudo entender el audio.")
return None

# Ruta a los archivos de información
info_dir = '/home/horaki/Ubicaciones_URP.txt'

# Inicializar el modelo y el tokenizador
model_name = 'gpt2'
tokenizer = GPT2Tokenizer.from_pretrained(model_name)
model = GPT2LMHeadModel.from_pretrained(model_name)

# Mover el modelo a la CPU
model.to('cpu')

# Configurar el micrófono
microphone = sr.Microphone()

while True:
print("Por favor, haz una pregunta sobre un lugar.")
question = recognize_speech_from_mic(recognizer, microphone)
if question:
print(f"Pregunta recibida: {question}")
# Buscar la información del lugar en los archivos
words = question.split()
lugar = words[-1].lower()
info_file = os.path.join(info_dir, f'{lugar}.txt')

# Leer la información
info = read_info(info_file)
if not info:
print(f"No se encontró información para {lugar}")
continue

# Crear el prompt con la información añadida
input_text = f"Información:\n{info}\n\nPregunta: {question}"

# Tokenizar el texto de entrada
input_ids = tokenizer.encode(input_text, return_tensors='pt')

# Generar texto
with torch.no_grad():
output = model.generate(input_ids, max_length=150, num_return_sequences=1)

# Decodificar y mostrar el texto generado
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print("\nRespuesta del modelo:\n")
print(generated_text)

# Convertir el texto generado a voz usando gTTS
tts = gTTS(generated_text, lang='es')
with tempfile.NamedTemporaryFile(delete=True) as fp:
tts.save(fp.name + ".mp3")
subprocess.run(['mpg321', fp.name + ".mp3"])
else:
print("No se recibió una pregunta válida.")

[/code]
Я пробовал изменить файл .txt, заменить микрофон и динамики и прочитать весь код, но я недостаточно разбираюсь в нем, чтобы понять, где ошибка. Я надеюсь, что вы можете мне помочь. Было бы очень здорово. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78700470/making-a-voice-assitant-in-raspberry-pi[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Команда adb для установки голосового помощника

Последнее сообщение Anonymous « 02 авг 2024, 06:18
Добавлено в форуме Android

Anonymous » 02 авг 2024, 06:18 » в форуме Android

Я работаю над голосовым помощником, и каждый раз, когда приложение развертывается на телефоне, мне нужно снова изменить помощника по умолчанию для моего приложения. Всего несколько кликов, но 100 раз в день, это время ушло!!
Нечто подобное...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
02 авг 2024, 06:18
Создание голосового помощника, такого как Jarvis, с использованием Python, но PyAudio не работает: «ОШИБКА: не удалось с

Последнее сообщение Anonymous « 31 окт 2024, 23:02
Добавлено в форуме Python

Anonymous » 31 окт 2024, 23:02 » в форуме Python

Когда я пытаюсь установить пакет PyAudio в Python версии 3.13.0. возникает следующая ошибка:

Как это исправить и почему возникает эта ошибка?
Note: This error originates from a subprocess, and is likely not a problem with pip.
ERROR: Failed...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
31 окт 2024, 23:02
Как запустить приложение с помощью значка запуска и голосового помощника, не создавая дублирующих действий?

Последнее сообщение Anonymous « 05 ноя 2024, 16:42
Добавлено в форуме JAVA

Anonymous » 05 ноя 2024, 16:42 » в форуме JAVA

Я разрабатываю средство запуска Android, и мне нужно запускать приложения двумя разными способами:

С помощью значка средства запуска .
С помощью специального голосового помощника .

Для этого у меня есть следующие требования:

Когда...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 16:42
Как запустить приложение с помощью значка запуска и голосового помощника, не создавая дублирующих действий?

Последнее сообщение Anonymous « 05 ноя 2024, 16:42
Добавлено в форуме Android

Anonymous » 05 ноя 2024, 16:42 » в форуме Android

Я разрабатываю средство запуска Android, и мне нужно запускать приложения двумя разными способами:

С помощью значка средства запуска .
С помощью специального голосового помощника .

Для этого у меня есть следующие требования:

При запуске...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 16:42
Как запустить приложение с помощью значка запуска и голосового помощника, не создавая дублирующих действий?

Последнее сообщение Anonymous « 05 ноя 2024, 17:46
Добавлено в форуме JAVA

Anonymous » 05 ноя 2024, 17:46 » в форуме JAVA

Я разрабатываю средство запуска Android, и мне нужно запускать приложения двумя разными способами:

С помощью значка средства запуска .
С помощью специального голосового помощника .

Для этого у меня есть следующие требования:

При запуске...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 17:46

Вернуться в «Python»