Не могу сгенерировать речь из библиотеки tts coqui-tts, и эта ошибка возникает при использовании одного и нескольких дин

Не могу сгенерировать речь из библиотеки tts coqui-tts, и эта ошибка возникает при использовании одного и нескольких дин ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Не могу сгенерировать речь из библиотеки tts coqui-tts, и эта ошибка возникает при использовании одного и нескольких дин

Цитата

Сообщение Anonymous » 27 сен 2024, 15:00

Код: Выделить всё

from TTS.utils.manage import ModelManager
from TTS.utils.synthesizer import Synthesizer

from google.colab import files

Initialize the model manager and load the models

model_name = "tts_models/en/ljspeech/tacotron2-DDC"

vocoder_name = "vocoder_models/en/ljspeech/hifigan_v2"

model_manager = ModelManager()

model_path, config_path, _ = model_manager.download_model(model_name)

vocoder_path, vocoder_config_path, _ = model_manager.download_model(vocoder_name)

Create the synthesizer object

synthesizer = Synthesizer(model_path, config_path, vocoder_path, vocoder_config_path, use_cuda=False)

Generate dynamic SSML based on manually chosen emotion

def generate_dynamic_ssml(chunk):

ssml = f""""""

# Uncomment the emotion you want to apply

ssml += f"
{chunk}"  # happy

# ssml += f"{chunk}"  # romantic

# ssml += f"{chunk}"  # hopeful

# ssml += f"{chunk}"  # neutral

# ssml += f"{chunk}"  # disappointed

# ssml += f"{chunk}"  # angry

# ssml += f"{chunk}"  # fearful

# ssml += f"{chunk}"  # sad

# ssml += f"{chunk}"  # devastated

ssml += ""

return ssml

Function to synthesize speech for each chunk

def synthesize_speech(text):

# Generate SSML for the whole text with a manually selected emotion

ssml = generate_dynamic_ssml(text)

# Synthesize the text

wav = synthesizer.tts(ssml)

# Save the output file

output_file = "output_with_emotion.wav"

synthesizer.save_wav(wav, output_file)

# Download the file to the local machine

files.download(output_file)

Example usage

if name == "main":

sample_text = """I am so happy to see you! You make my heart race with joy and love."""

# Convert text to speech with the selected emotion

synthesize_speech(sample_text)

код с использованием модели tacotron2 и вокодера hifigen, после этого я использую библиотеку синтезатора ssml, которая изменяет высоту голоса, чтобы сделать его похожим на эмоции

Код: Выделить всё

AttributeError                            Traceback (most recent call last)

 in ()

53

54     # Convert text to speech with the selected emotion

---> 55     synthesize_speech(sample_text)

1 frames

 in synthesize_speech(text)

39

40     # Synthesize the text

---> 41     wav = synthesizer.tts(ssml)

42

43     # Save the output file

/usr/local/lib/python3.10/dist-packages/TTS/utils/synthesizer.py in tts(self, text, speaker_name, language_name, speaker_wav, style_wav, style_text, reference_wav, reference_speaker_name, split_sentences, **kwargs)

320                     speaker_id = self.tts_model.speaker_manager.name_to_id[speaker_name]

321             # handle Neon models with single speaker.

--> 322             elif len(self.tts_model.speaker_manager.name_to_id) == 1:

323                 speaker_id = list(self.tts_model.speaker_manager.name_to_id.values())[0]

324             elif not speaker_name and not speaker_wav:

AttributeError: 'NoneType' object has no attribute 'name_to_id' that is the error

этот код tts использует coqui-tts, которые создают эмоциональные tts, поэтому всегда возникает следующая ошибка, и я попытался сделать код одним и несколькими динамиками
сделайте одиночные и несколько динамиков, возможно, кто-нибудь знает решение или посоветует мне использовать другую модель, я хочу бесплатную

Подробнее здесь: https://stackoverflow.com/questions/790 ... -happens-i

1727438455

Anonymous

[code]from TTS.utils.manage import ModelManager
from TTS.utils.synthesizer import Synthesizer

from google.colab import files

Initialize the model manager and load the models

model_name = "tts_models/en/ljspeech/tacotron2-DDC"

vocoder_name = "vocoder_models/en/ljspeech/hifigan_v2"

model_manager = ModelManager()

model_path, config_path, _ = model_manager.download_model(model_name)

vocoder_path, vocoder_config_path, _ = model_manager.download_model(vocoder_name)

Create the synthesizer object

synthesizer = Synthesizer(model_path, config_path, vocoder_path, vocoder_config_path, use_cuda=False)

Generate dynamic SSML based on manually chosen emotion

def generate_dynamic_ssml(chunk):

ssml = f""""""

# Uncomment the emotion you want to apply

ssml += f"
{chunk}"  # happy

# ssml += f"{chunk}"  # romantic

# ssml += f"{chunk}"  # hopeful

# ssml += f"{chunk}"  # neutral

# ssml += f"{chunk}"  # disappointed

# ssml += f"{chunk}"  # angry

# ssml += f"{chunk}"  # fearful

# ssml += f"{chunk}"  # sad

# ssml += f"{chunk}"  # devastated

ssml += ""

return ssml

Function to synthesize speech for each chunk

def synthesize_speech(text):

# Generate SSML for the whole text with a manually selected emotion

ssml = generate_dynamic_ssml(text)

# Synthesize the text

wav = synthesizer.tts(ssml)

# Save the output file

output_file = "output_with_emotion.wav"

synthesizer.save_wav(wav, output_file)

# Download the file to the local machine

files.download(output_file)

Example usage

if name == "main":

sample_text = """I am so happy to see you! You make my heart race with joy and love."""

# Convert text to speech with the selected emotion

synthesize_speech(sample_text)
[/code]
код с использованием модели tacotron2 и вокодера hifigen, после этого я использую библиотеку синтезатора ssml, которая изменяет высоту голоса, чтобы сделать его похожим на эмоции
[code]AttributeError                            Traceback (most recent call last)

 in ()

53

54     # Convert text to speech with the selected emotion

---> 55     synthesize_speech(sample_text)

1 frames

 in synthesize_speech(text)

39

40     # Synthesize the text

---> 41     wav = synthesizer.tts(ssml)

42

43     # Save the output file

/usr/local/lib/python3.10/dist-packages/TTS/utils/synthesizer.py in tts(self, text, speaker_name, language_name, speaker_wav, style_wav, style_text, reference_wav, reference_speaker_name, split_sentences, **kwargs)

320                     speaker_id = self.tts_model.speaker_manager.name_to_id[speaker_name]

321             # handle Neon models with single speaker.

--> 322             elif len(self.tts_model.speaker_manager.name_to_id) == 1:

323                 speaker_id = list(self.tts_model.speaker_manager.name_to_id.values())[0]

324             elif not speaker_name and not speaker_wav:

AttributeError: 'NoneType' object has no attribute 'name_to_id' that is the error

[/code]
этот код tts использует coqui-tts, которые создают эмоциональные tts, поэтому всегда возникает следующая ошибка, и я попытался сделать код одним и несколькими динамиками
сделайте одиночные и несколько динамиков, возможно, кто-нибудь знает решение или посоветует мне использовать другую модель, я хочу бесплатную
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79031258/cant-generate-the-speech-from-library-tts-of-coqui-tts-and-this-error-happens-i[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Не могу сгенерировать речь из библиотеки tts coqui-tts, и эта ошибка возникает при использовании одного и нескольких дин

Последнее сообщение Anonymous « 27 сен 2024, 16:16
Добавлено в форуме Python

Anonymous » 27 сен 2024, 16:16 » в форуме Python

from TTS.utils.manage import ModelManager
from TTS.utils.synthesizer import Synthesizer

from google.colab import files

Initialize the model manager and load the models

model_name = tts_models/en/ljspeech/tacotron2-DDC

vocoder_name =...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
27 сен 2024, 16:16
Ошибка UnicodeDecode зависимости Jamo при клонировании репозитория coqui ai/TTS

Последнее сообщение Anonymous « 11 окт 2024, 15:06
Добавлено в форуме Python

Anonymous » 11 окт 2024, 15:06 » в форуме Python

ИНФО: pip просматривает несколько версий nltk, чтобы определить, какая версия совместима с другими требованиями. Это может занять некоторое время.
Сбор nltk
Загрузка nltk-3.9-py3-none-any.whl (1,5 МБ)
━━━━━━━━━━━━━━ ━━━━━━━━━━━━━━━━━━━━━━━━━━...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
11 окт 2024, 15:06
Ошибка разрешения при попытке запустить TTS из руководства для начинающих Coqui.

Последнее сообщение Anonymous « 09 ноя 2024, 14:31
Добавлено в форуме Python

Anonymous » 09 ноя 2024, 14:31 » в форуме Python

Я пытаюсь работать с Coqui TTS, следуя руководству для начинающих « но постоянно сталкиваюсь с ошибкой разрешения. Для обучения я использую следующий код:
import os
import torch
from trainer import Trainer, TrainerArgs
from...

0 Ответы

53 Просмотры

Последнее сообщение Anonymous
09 ноя 2024, 14:31
Ошибка разрешения при попытке запустить TTS из руководства для начинающих Coqui.

Последнее сообщение Anonymous « 10 ноя 2024, 03:57
Добавлено в форуме Python

Anonymous » 10 ноя 2024, 03:57 » в форуме Python

Я пытаюсь работать с Coqui TTS, следуя руководству для начинающих но постоянно сталкиваюсь с ошибкой разрешения. Для обучения я использую следующий код:
import os
import torch
from trainer import Trainer, TrainerArgs
from...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
10 ноя 2024, 03:57
Как использовать ZLUDA с Coqui TTS на графическом процессоре AMD?

Последнее сообщение Anonymous « 26 июн 2024, 07:48
Добавлено в форуме Python

Anonymous » 26 июн 2024, 07:48 » в форуме Python

Я долго искал эту проблему. Кстати, я использую графический процессор RX570 4 ГБ Sapphire Pulse, и есть несколько руководств по установке zluda с помощью SDNext, но я считаю, что это не относится к моему варианту использования. Я знаю, что zluda...

0 Ответы

41 Просмотры

Последнее сообщение Anonymous
26 июн 2024, 07:48

Вернуться в «Python»