Я использовал репозиторий с открытым исходным кодом Coqui для создания модели голосового клона. Он использует различные модели tts_models, обученные с использованием наборов данных LJSpeech. Я использовал многоязычную модель для использования предоставленного мной образца. Однако я получаю следующую ошибку:
ValueError: [!] Похоже, вы используете многоязычную модель. Чтобы использовать многоязычную модель, вам необходимо определить либо языковое_имя, либо style_wav.
Я использовал для этого виртуальную среду Google Colab при разработке Coqui. для Linux.
Вот мой код:
!git clone https://github.com/coqui-ai/TTS
!pip install TTS
!sudo apt-get install espeak-ng
!pip install IPython
from google.colab import drive
drive.mount('/content/drive')
import os
os.chdir('/content/drive/MyDrive/TTS')
!cd TTS
!ls
!tts --list_models
!python -c 'from TTS.utils.downloaders import download_ljspeech; download_ljspeech("/content/drive/MyDrive/TTS/recipes/ljspeech/");'
!tts --text "The economy suffered a great deal." \
--model_name "tts_models/multilingual/multi-dataset/your_tts" --speaker_wav "/content/drive/MyDrive/TTS/recipes/ljspeech/LJSpeech-1.1/Sample.wav" --out_path /content/drive/MyDrive/TTS/output.wav
from IPython.display import Audio
display(Audio('/content/drive/MyDrive/TTS/output.wav'))
Подробнее здесь: https://stackoverflow.com/questions/747 ... ce-cloning
Клонирование голоса TTS ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение