Как настроить Google TTS SSML в соответствии с оригинальным временем SRT? - Цифровое Кемерово

Как настроить Google TTS SSML в соответствии с оригинальным временем SRT? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как настроить Google TTS SSML в соответствии с оригинальным временем SRT?

Цитата

Сообщение Anonymous » 02 апр 2025, 19:22

У меня есть файл .srt, где каждый сегмент речи должен длиться определенную продолжительность (например, 4 секунды). Однако, когда я генерирую речь, используя Google Text-Sweek (TTS) с SSML, полученный звук воспроизводит один и тот же сегмент за более короткое время (например, 3 секунды). < /P>
Я хочу отрегулировать скорость речи в SSML, чтобы каждый сегмент соответствовал исходному времени. Моя идея состоит в том, чтобы использовать FFMPEG для извлечения фактической продолжительности каждого сгенерированного речевого сегмента, а затем вычислить процент скорости речи как:
, сгенерированная продолжительность
Speat = --------------------
Оригинальная продолжительность < /p>
Затем будет применяться в SSML, используя теги, как:

popken < /p> popkenge < /p> popken < /popken < /popken < /popken < /popken < /popken < /popken < /popken < /p). Точно измеряйте продолжительность каждого сегмента, используя FFMPEG, и как лучше всего применить правильную скорость речи в SSML, чтобы соответствовать исходному времени .SRT? f.write(f'\t
{break_until_start}{text}
\n')
< /code>
Кодовое написание SSML: < /p>
text = value ['text']
start_time_ms = int (value ['start_ms']) # Время начала в Milliseconds
предыдущий Время
GAP_TO_FILL = max (0, start_time_ms - предыдущий_END_MS) < /p>
text = text.replace("&", "&").replace('"', """).replace("'", "'").replace("", ">")

break_until_start = f'
' if gap_to_fill > 0 else ''

f.write(f'\t
{break_until_start}{text}
\n')

f.write('\n')

Подробнее здесь: https://stackoverflow.com/questions/795 ... srt-timing

Реклама

1743610974

Anonymous

 У меня есть файл .srt, где каждый сегмент речи должен длиться определенную продолжительность (например, 4 секунды). Однако, когда я генерирую речь, используя Google Text-Sweek (TTS) с SSML, полученный звук воспроизводит один и тот же сегмент за более короткое время (например, 3 секунды). < /P>
Я хочу отрегулировать скорость речи в SSML, чтобы каждый сегмент соответствовал исходному времени. Моя идея состоит в том, чтобы использовать FFMPEG для извлечения фактической продолжительности каждого сгенерированного речевого сегмента, а затем вычислить процент скорости речи как:
, сгенерированная продолжительность
Speat = --------------------
Оригинальная продолжительность < /p>
Затем будет применяться в SSML, используя теги, как:

popken < /p> popkenge < /p> popken < /popken < /popken < /popken < /popken < /popken < /popken < /popken < /p). Точно измеряйте продолжительность каждого сегмента, используя FFMPEG, и как лучше всего применить правильную скорость речи в SSML, чтобы соответствовать исходному времени .SRT?        f.write(f'\t
{break_until_start}{text}
\n')
< /code>
Кодовое написание SSML: < /p>
text = value ['text']
start_time_ms = int (value ['start_ms']) # Время начала в Milliseconds
предыдущий Время
GAP_TO_FILL = max (0, start_time_ms - предыдущий_END_MS) < /p>
        text = text.replace("&", "&").replace('"', """).replace("'", "&apos;").replace("", ">")

break_until_start = f'
' if gap_to_fill > 0 else ''

f.write(f'\t
{break_until_start}{text}
\n')

f.write('\n')
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79551084/how-to-adjust-google-tts-ssml-to-match-original-srt-timing[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Не могу сгенерировать речь из библиотеки tts coqui-tts, и эта ошибка возникает при использовании одного и нескольких дин

Последнее сообщение Anonymous « 27 сен 2024, 15:00
Добавлено в форуме Python

Anonymous » 27 сен 2024, 15:00 » в форуме Python

from TTS.utils.manage import ModelManager
from TTS.utils.synthesizer import Synthesizer

from google.colab import files

Initialize the model manager and load the models

model_name = tts_models/en/ljspeech/tacotron2-DDC

vocoder_name =...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
27 сен 2024, 15:00
Не могу сгенерировать речь из библиотеки tts coqui-tts, и эта ошибка возникает при использовании одного и нескольких дин

Последнее сообщение Anonymous « 27 сен 2024, 16:16
Добавлено в форуме Python

Anonymous » 27 сен 2024, 16:16 » в форуме Python

from TTS.utils.manage import ModelManager
from TTS.utils.synthesizer import Synthesizer

from google.colab import files

Initialize the model manager and load the models

model_name = tts_models/en/ljspeech/tacotron2-DDC

vocoder_name =...

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
27 сен 2024, 16:16
Flutter TTS не находит сторонние механизмы TTS

Последнее сообщение Anonymous « 01 ноя 2024, 17:03
Добавлено в форуме Android

Anonymous » 01 ноя 2024, 17:03 » в форуме Android

У меня есть приложение Flutter для Android, в котором мне нужно, чтобы TTS произнес предложение. Это отлично работает с GoogleTTS, но мне бы хотелось более естественный голос, например Акапела или Пико. Но даже несмотря на то, что я установил движок...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 17:03
Flutter TTS не находит сторонние механизмы TTS

Последнее сообщение Anonymous « 02 ноя 2024, 12:32
Добавлено в форуме Android

Anonymous » 02 ноя 2024, 12:32 » в форуме Android

У меня есть приложение Flutter для Android, в котором мне нужно, чтобы TTS произнес предложение. Это отлично работает с GoogleTTS, но мне бы хотелось более естественный голос, например Акапела или Пико. Но даже несмотря на то, что я установил движок...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
02 ноя 2024, 12:32
Автоматическое обнаружение TTS, выбранных пользователем и инициализацией конструктора класса TTS [дубликат]

Последнее сообщение Anonymous « 05 фев 2025, 00:35
Добавлено в форуме Android

Anonymous » 05 фев 2025, 00:35 » в форуме Android

Я создал класс, который инициализирует объект TTS (текст к речи) и контролирует, когда инициализация завершена. Я также реализовал две функции:

releaseOfTtsResources
toSpeak

package com.gtdvm.echopoint.utils

import android.content.Context...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
05 фев 2025, 00:35

Вернуться в «Python»

Programmiererforum