Как можно расшифровать аудиофайлы слово в слово, используя шепот OpenAI?Python

Программы на Python
Ответить
Anonymous
 Как можно расшифровать аудиофайлы слово в слово, используя шепот OpenAI?

Сообщение Anonymous »

Я пытаюсь расшифровать первые 30 секунд песни Эминема Rap God слово в слово, используя шепот OpenAI через cmd:

Код: Выделить всё

C:\Users\...\songs\Eminem - Rap God>whisper "clip_0_30.wav" --language en --device cpu --word_timestamps True
C:\Users\...\Python\Python313\Lib\site-packages\whisper\transcribe.py:130: UserWarning: Performing inference on CPU when CUDA is available
warnings.warn("Performing inference on CPU when CUDA is available")
C:\Users\...\Python\Python313\Lib\site-packages\whisper\transcribe.py:132: UserWarning: FP16 is not supported on CPU; using FP32 instead
warnings.warn("FP16 is not supported on CPU; using FP32 instead")
[00:01.500 --> 00:08.360]  Look, I was going to go easy on you not to hurt your feelings, but I'm only going to get this one chance.
[00:09.680 --> 00:11.420]  Something's wrong, I can feel it.
[00:11.580 --> 00:17.200]  It's just a feeling I've got, like something's about to happen, but I don't know what.
[00:17.600 --> 00:20.920]  If that means what I think it means, we're in trouble, big trouble.
[00:21.120 --> 00:24.140]  And if he is bananas as you say, I'm not taking any chances.
[00:24.440 --> 00:25.780]  You're just one of the stockholders.
[00:25.780 --> 00:29.880]  I'm beginning to feel like a rap god, rap god, all my people.
Как показано, я устанавливаю --word_timestamps True, однако программа не возвращает временные метки слово в слово. Инструкция --help, похоже, указывает на то, что такого аргумента достаточно:

Код: Выделить всё

C:\Users\...\songs\Eminem - Rap God>whisper --help
...
--word_timestamps WORD_TIMESTAMPS
(experimental) extract word-level timestamps and refine the results based on them (default: False)
...
Мне не удалось найти много документации по шепоту на GitHub, и я надеялся, что кто-нибудь из присутствующих сможет указать мне правильное направление.

Подробнее здесь: https://stackoverflow.com/questions/798 ... is-whisper
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»