Урду Tts можно использовать с Python [закрыто]

Урду Tts можно использовать с Python [закрыто] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Урду Tts можно использовать с Python [закрыто]

Цитата

Сообщение Anonymous » 28 июл 2024, 03:56

Я хочу создать TTS для языка урду
может ли кто-нибудь помочь?
я нашел несколько моделей с обнимающимся лицом, как
TheUpperCaseGuy/Guy-Urdu-TTS
pocketmonkey/speecht5_tts_urdu
Talha185/speecht5_finetuned_urdu_TTS
но я не могу создать или сгенерировать речь хорошего качества из текста
может ли кто-нибудь помочь ????

Код: Выделить всё

import torch
from transformers import SpeechT5ForTextToSpeech, SpeechT5HifiGan, AutoTokenizer
import soundfile as sf
from datasets import load_dataset

# Load the model and tokenizer
model_name = "pocketmonkey/speecht5_tts_urdu"
model = SpeechT5ForTextToSpeech.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
vocoder = SpeechT5HifiGan.from_pretrained("microsoft/speecht5_hifigan")

# Load speaker embeddings
embeddings_dataset = load_dataset("Matthijs/cmu-arctic-xvectors", split="validation")
speaker_embeddings = torch.tensor(embeddings_dataset[7306]["xvector"]).unsqueeze(0)

# Prepare the text input
urdu_text = ",HELLO HOW ARE YOU,AUR BATAO KESE HO AAJ KAL?آپ کیسے ہیں؟"  # "How are you?" in Urdu
inputs = tokenizer(text=urdu_text, return_tensors="pt")

# Generate speech
speech = model.generate_speech(inputs["input_ids"], vocoder=vocoder, speaker_embeddings=speaker_embeddings)

# Save the audio file
sf.write("output.wav", speech.numpy(), samplerate=16000)

print("Audio saved as 'output.wav'")`

но результаты недостаточно хороши

Подробнее здесь: https://stackoverflow.com/questions/788 ... ith-python

1722128192

Anonymous

Я хочу создать TTS для языка урду
может ли кто-нибудь помочь?
я нашел несколько моделей с обнимающимся лицом, как
TheUpperCaseGuy/Guy-Urdu-TTS
pocketmonkey/speecht5_tts_urdu
Talha185/speecht5_finetuned_urdu_TTS
но я не могу создать или сгенерировать речь хорошего качества из текста
может ли кто-нибудь помочь ???? 
[code]import torch
from transformers import SpeechT5ForTextToSpeech, SpeechT5HifiGan, AutoTokenizer
import soundfile as sf
from datasets import load_dataset

# Load the model and tokenizer
model_name = "pocketmonkey/speecht5_tts_urdu"
model = SpeechT5ForTextToSpeech.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
vocoder = SpeechT5HifiGan.from_pretrained("microsoft/speecht5_hifigan")

# Load speaker embeddings
embeddings_dataset = load_dataset("Matthijs/cmu-arctic-xvectors", split="validation")
speaker_embeddings = torch.tensor(embeddings_dataset[7306]["xvector"]).unsqueeze(0)

# Prepare the text input
urdu_text = ",HELLO HOW ARE YOU,AUR BATAO KESE HO AAJ KAL?آپ کیسے ہیں؟"  # "How are you?" in Urdu
inputs = tokenizer(text=urdu_text, return_tensors="pt")

# Generate speech
speech = model.generate_speech(inputs["input_ids"], vocoder=vocoder, speaker_embeddings=speaker_embeddings)

# Save the audio file
sf.write("output.wav", speech.numpy(), samplerate=16000)

print("Audio saved as 'output.wav'")`

[/code]
но результаты недостаточно хороши 

Подробнее здесь: [url]https://stackoverflow.com/questions/78802573/urdu-tts-usable-with-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Не могу сгенерировать речь из библиотеки tts coqui-tts, и эта ошибка возникает при использовании одного и нескольких дин

Последнее сообщение Anonymous « 27 сен 2024, 15:00
Добавлено в форуме Python

Anonymous » 27 сен 2024, 15:00 » в форуме Python

from TTS.utils.manage import ModelManager
from TTS.utils.synthesizer import Synthesizer

from google.colab import files

Initialize the model manager and load the models

model_name = tts_models/en/ljspeech/tacotron2-DDC

vocoder_name =...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
27 сен 2024, 15:00
Не могу сгенерировать речь из библиотеки tts coqui-tts, и эта ошибка возникает при использовании одного и нескольких дин

Последнее сообщение Anonymous « 27 сен 2024, 16:16
Добавлено в форуме Python

Anonymous » 27 сен 2024, 16:16 » в форуме Python

from TTS.utils.manage import ModelManager
from TTS.utils.synthesizer import Synthesizer

from google.colab import files

Initialize the model manager and load the models

model_name = tts_models/en/ljspeech/tacotron2-DDC

vocoder_name =...

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
27 сен 2024, 16:16
Flutter TTS не находит сторонние механизмы TTS

Последнее сообщение Anonymous « 01 ноя 2024, 17:03
Добавлено в форуме Android

Anonymous » 01 ноя 2024, 17:03 » в форуме Android

У меня есть приложение Flutter для Android, в котором мне нужно, чтобы TTS произнес предложение. Это отлично работает с GoogleTTS, но мне бы хотелось более естественный голос, например Акапела или Пико. Но даже несмотря на то, что я установил движок...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 17:03
Flutter TTS не находит сторонние механизмы TTS

Последнее сообщение Anonymous « 02 ноя 2024, 12:32
Добавлено в форуме Android

Anonymous » 02 ноя 2024, 12:32 » в форуме Android

У меня есть приложение Flutter для Android, в котором мне нужно, чтобы TTS произнес предложение. Это отлично работает с GoogleTTS, но мне бы хотелось более естественный голос, например Акапела или Пико. Но даже несмотря на то, что я установил движок...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
02 ноя 2024, 12:32
Автоматическое обнаружение TTS, выбранных пользователем и инициализацией конструктора класса TTS [дубликат]

Последнее сообщение Anonymous « 05 фев 2025, 00:35
Добавлено в форуме Android

Anonymous » 05 фев 2025, 00:35 » в форуме Android

Я создал класс, который инициализирует объект TTS (текст к речи) и контролирует, когда инициализация завершена. Я также реализовал две функции:

releaseOfTtsResources
toSpeak

package com.gtdvm.echopoint.utils

import android.content.Context...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
05 фев 2025, 00:35

Вернуться в «Python»