Как извлечь видео -транскрипты на YouTube с использованием API YouTube на Python

Как извлечь видео -транскрипты на YouTube с использованием API YouTube на Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как извлечь видео -транскрипты на YouTube с использованием API YouTube на Python

Цитата

Сообщение Anonymous » 25 янв 2025, 12:10

Я пытаюсь извлечь расшифровки видео с YouTube с помощью Youtube API или другого пакета Python.
Я нашел код в Google и попробовал.
# importing the module
from youtube_transcript_api import YouTubeTranscriptApi

# retrieve the available transcripts
transcript_list = YouTubeTranscriptApi.list_transcripts('pxiP-HJLCx0')

# iterate over all available transcripts
for transcript in transcript_list:

# the Transcript object provides metadata
# properties
print(
transcript.video_id,
transcript.language,
transcript.language_code,

# whether it has been manually created or
# generated by YouTube
transcript.is_generated,

# whether this transcript can be translated
# or not
transcript.is_translatable,

# a list of languages the transcript can be
# translated to
transcript.translation_languages,
)

# fetch the actual transcript data
print(transcript.fetch())

# translating the transcript will return another
# transcript object
print(transcript.translate('en').fetch())

# you can also directly filter for the language you are
# looking for, using the transcript list
transcript = transcript_list.find_transcript(['en'])

# or just filter for manually created transcripts
transcript = transcript_list.find_manually_created_transcript(['en'])

# importing modules
from youtube_transcript_api import YouTubeTranscriptApi

# using the srt variable with the list of dictionaries
# obtained by the .get_transcript() function
srt = YouTubeTranscriptApi.get_transcript("pxiP-HJLCx0")

# creating or overwriting a file "subtitles.txt" with
# the info inside the context manager
with open("subtitles.txt", "w") as f:

# iterating through each element of list srt
for i in srt:
# writing each element of srt on a new line
f.write("{}\n".format(i))
< /code>
Он извлекает транскрипты, но проблема в том, что он содержит не только текст, но и время начала и продолжительности. Поскольку не существует знаков препинания, предложения не разделены, и кажется, что слова только что перечислены в ряду, что затрудняет анализ текста. < /P>
{'text': "in this video I'm going to tell you the", 'start': 0.0, 'duration': 4.74}
{'text': 'best laptops for students now for this', 'start': 2.159, 'duration': 5.16}
{'text': 'one my team and I went absolutely nuts', 'start': 4.74, 'duration': 4.68}
{'text': 'we got in pretty much every viable', 'start': 7.319, 'duration': 4.801}
{'text': "student laptop think I'm joking I am not", 'start': 9.42, 'duration': 6.299}
{'text': 'we tested an epic 15 laptops everything', 'start': 12.12, 'duration': 5.52}
< /code>
Как я могу решить эту проблему? Спасибо

Подробнее здесь: https://stackoverflow.com/questions/768 ... -on-python

1737796256

Anonymous

Я пытаюсь извлечь расшифровки видео с YouTube с помощью Youtube API или другого пакета Python.
Я нашел код в Google и попробовал.
# importing the module
from youtube_transcript_api import YouTubeTranscriptApi

# retrieve the available transcripts
transcript_list = YouTubeTranscriptApi.list_transcripts('pxiP-HJLCx0')

# iterate over all available transcripts
for transcript in transcript_list:

# the Transcript object provides metadata
# properties
print(
transcript.video_id,
transcript.language,
transcript.language_code,

# whether it has been manually created or
# generated by YouTube
transcript.is_generated,

# whether this transcript can be translated
# or not
transcript.is_translatable,

# a list of languages the transcript can be
# translated to
transcript.translation_languages,
)

# fetch the actual transcript data
print(transcript.fetch())

# translating the transcript will return another
# transcript object
print(transcript.translate('en').fetch())

# you can also directly filter for the language you are
# looking for, using the transcript list
transcript = transcript_list.find_transcript(['en'])

# or just filter for manually created transcripts
transcript = transcript_list.find_manually_created_transcript(['en'])

# importing modules
from youtube_transcript_api import YouTubeTranscriptApi

# using the srt variable with the list of dictionaries
# obtained by the .get_transcript() function
srt = YouTubeTranscriptApi.get_transcript("pxiP-HJLCx0")

# creating or overwriting a file "subtitles.txt" with
# the info inside the context manager
with open("subtitles.txt", "w") as f:

# iterating through each element of list srt
for i in srt:
# writing each element of srt on a new line
f.write("{}\n".format(i))
< /code>
Он извлекает транскрипты, но проблема в том, что он содержит не только текст, но и время начала и продолжительности. Поскольку не существует знаков препинания, предложения не разделены, и кажется, что слова только что перечислены в ряду, что затрудняет анализ текста. < /P>
{'text': "in this video I'm going to tell you the", 'start': 0.0, 'duration': 4.74}
{'text': 'best laptops for students now for this', 'start': 2.159, 'duration': 5.16}
{'text': 'one my team and I went absolutely nuts', 'start': 4.74, 'duration': 4.68}
{'text': 'we got in pretty much every viable', 'start': 7.319, 'duration': 4.801}
{'text': "student laptop think I'm joking I am not", 'start': 9.42, 'duration': 6.299}
{'text': 'we tested an epic 15 laptops everything', 'start': 12.12, 'duration': 5.52}
< /code>
Как я могу решить эту проблему? Спасибо  

Подробнее здесь: [url]https://stackoverflow.com/questions/76856230/how-to-extract-youtube-video-transcripts-using-youtube-api-on-python[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Microsoft Graph API: не удалось выполнить запрос на бэкэнд - получить транскрипты

Последнее сообщение Anonymous « 29 май 2025, 18:24
Добавлено в форуме C#

Anonymous » 29 май 2025, 18:24 » в форуме C#

В настоящее время я делаю программу, которая извлекает стенограмму команд для недавней встречи в C#. Я использую делегированные разрешения с помощью учетной записи, которая является коорганизатором встречи, чтобы совершать звонки через API. У меня...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
29 май 2025, 18:24
Twilio Media Streams + ElevenLabs + Openai (Python): Call Connects, транскрипты работают, но вызывающий звонок слышит мо

Последнее сообщение Anonymous « 13 июл 2025, 19:35
Добавлено в форуме Python

Anonymous » 13 июл 2025, 19:35 » в форуме Python

Я построил голосового помощника в реальном времени, используя Twilio Media Streams, Openai GPT и ElevenLabs, с аудио, обрабатываемым на Python с использованием Quart + Hypercorn. Приложение подключает, транскрибирует голоса из LL, генерирует ответ и...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
13 июл 2025, 19:35
Как добавить текущий URL -адрес страницы в транскрипты агента Voiceflow AI

Последнее сообщение Anonymous « 23 апр 2025, 12:23
Добавлено в форуме Javascript

Anonymous » 23 апр 2025, 12:23 » в форуме Javascript

Как я могу добавить URL -адрес страницы (где пользователь открыл чат -бот) в транскрипцию агента AI Voiceflow? Это поможет нам понять, какие страницы веб -сайтов задают свои вопросы! Я попробовал следующее, но не работал:
(function(d, t) {
var v =...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
23 апр 2025, 12:23
Воспроизведение видео на YouTube: Аккаунт YouTube, связанный с этим видео, закрыт.

Последнее сообщение Anonymous « 17 янв 2025, 21:29
Добавлено в форуме IOS

Anonymous » 17 янв 2025, 21:29 » в форуме IOS

Я воспроизвожу видео из плейлиста своего аккаунта. Но некоторые видео не воспроизводятся с ошибкой в веб-просмотре.

- (void)playVideoWithId:(NSString *)videoId {

NSString *youTubeVideoHTML = @ body{margin:0px 0px 0px 0px;} var tag =...

0 Ответы

57 Просмотры

Последнее сообщение Anonymous
17 янв 2025, 21:29
Как извлечь заголовки видео с помощью Youtube API (Python)

Последнее сообщение Anonymous « 28 июн 2024, 22:04
Добавлено в форуме Python

Anonymous » 28 июн 2024, 22:04 » в форуме Python

Я создаю для себя небольшое приложение на Python, которое загружает информацию из видеороликов YouTube, и для этого я использую API YouTube.
Недавно я посмотрел это видео, чтобы помочь мне получить комментарии. и их ответы из видео на YouTube и...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
28 июн 2024, 22:04

Вернуться в «Python»