Почему мой файл .mp4, созданный с помощью cv2.VideoWriter, не синхронизируется со звуком, когда я объединяю видео и ауди

Почему мой файл .mp4, созданный с помощью cv2.VideoWriter, не синхронизируется со звуком, когда я объединяю видео и ауди ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Почему мой файл .mp4, созданный с помощью cv2.VideoWriter, не синхронизируется со звуком, когда я объединяю видео и ауди

Цитата

Сообщение Anonymous » 27 дек 2024, 20:18

Цель скрипта — взять текст из текстового файла и поместить его в стоковое видео, где текст будет читать искусственный интеллект. Похоже на те истории на Reddit в социальных сетях, где на заднем плане паркур в Майнкрафте.

Код: Выделить всё

import cv2
import time
from ffpyplayer.player import MediaPlayer
from Transcription import newTranscribeAudio
from pydub import AudioSegment

#get a gpt text generation to create a story based on a prompt, for example sci-fi story and spread it over 3-4 parts
#get stock footage, like minecraft parkour etc
#write text of script on the footage
#create video for each part
#have ai voiceover to read the transcript
cap = cv2.VideoCapture("Stock_Videos\Minecraft_Parkour.mp4")
transcription = newTranscribeAudio("final_us.wav")
player = MediaPlayer("final_us.mp3")
audio = AudioSegment.from_file("final_us.mp3")
story = open("Story.txt", "r").read()
story_split = story.split("||")
fps = cap.get(cv2.CAP_PROP_FPS)
frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
video_duration = frame_count / fps  # Duration of one loop of the video
fourcc = cv2.VideoWriter_fourcc(*"mp4v")
audio_duration = len(audio) / 1000  # Duration in seconds
video_writer = cv2.VideoWriter(f"CompletedVideo.mp4", fourcc, fps, (1080, 1920))

choice = 0#part of the story choice
part_split = story_split[choice].split(" ")
with open("Segment.txt", "w") as file:
file.write(story_split[choice])
start_time = time.time()
length = len(part_split) - 1
next_text = []
for j in range(0, length):
temp = part_split[j].replace("\n", "")
next_text.append([temp])
index = 0
word_index = 0
frame_size_x = 1080
frame_size_y = 1920
audio_duration = len(audio) / 1000  # Duration in seconds
start_time = time.time()
wait_time = 1 / fps
while (time.time() - start_time) < audio_duration:
cap.set(cv2.CAP_PROP_POS_FRAMES, 0)  # Restart video
elapsed_time = time.time() - start_time
print(video_writer)
if index >= len(transcription):
break
while cap.isOpened():
# Capture frames in the video
ret, frame = cap.read()
if not ret:
break
audio_frame, val = player.get_frame()
if val == 'eof':  # End of file
print("Audio playback finished.")
break
if index >= len(transcription):
break

if frame_size_x == -1:
frame_size_x = frame.shape[1]
frame_size_y = frame.shape[0]

elapsed_time = time.time() - start_time

# describe the type of font
# to be used.
font = cv2.FONT_HERSHEY_SIMPLEX
trans = transcription[index]["words"]
end_time = trans[word_index]["end"]
if trans[word_index]["start"] < elapsed_time < trans[word_index]["end"]:
video_text = trans[word_index]["text"]
elif elapsed_time >= trans[word_index]["end"]:
#index += 1
word_index += 1
if (word_index >= len(trans)):
index += 1
word_index = 0
# get boundary of this text
textsize = cv2.getTextSize(video_text, font, 3, 6)[0]
# get coords based on boundary
textX = int((frame.shape[1] - textsize[0]) / 2)
textY = int((frame.shape[0] + textsize[1]) / 2)

cv2.putText(frame,
video_text,
(textX, textY),
font, 3,
(0, 255, 255),
6,
cv2.LINE_4)

# Define the resize scale
scale_percent = 50  # Resize to 50% of the original size
# Get new dimensions
width = 1080
height = 1920
new_size = (width, height)

# Resize the frame
resized_frame = cv2.resize(frame, new_size)
video_writer.write(resized_frame)
cv2.imshow('video', resized_frame)
cv2.waitKey(wait_time)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
cv2.destroyAllWindows()
video_writer.release()
cap.release()

Когда я запускаю этот скрипт, звук идеально соответствует тексту в видео и работает столько времени, сколько соответствует звуку (2 минуты 44 секунды). Однако сохраненное видео CompletedVideo.mp4 длится всего 1 минуту 10 секунд. Непонятно, почему видео ускорилось. Фпс составляет 60 кадров в секунду. Если вам нужна дополнительная информация, дайте мне знать и заранее спасибо.
Я пробовал менять частоту кадров, меняя время ожидания после записи каждого кадра. Я ожидаю, что CompletedVideo.mp4 будет длиться 2 минуты 44 секунды, а не 1 минуту 10 секунд.

Подробнее здесь: https://stackoverflow.com/questions/793 ... -the-audio

1735319896

Anonymous

Цель скрипта — взять текст из текстового файла и поместить его в стоковое видео, где текст будет читать искусственный интеллект. Похоже на те истории на Reddit в социальных сетях, где на заднем плане паркур в Майнкрафте.
[code]import cv2
import time
from ffpyplayer.player import MediaPlayer
from Transcription import newTranscribeAudio
from pydub import AudioSegment

#get a gpt text generation to create a story based on a prompt, for example sci-fi story and spread it over 3-4 parts
#get stock footage, like minecraft parkour etc
#write text of script on the footage
#create video for each part
#have ai voiceover to read the transcript
cap = cv2.VideoCapture("Stock_Videos\Minecraft_Parkour.mp4")
transcription = newTranscribeAudio("final_us.wav")
player = MediaPlayer("final_us.mp3")
audio = AudioSegment.from_file("final_us.mp3")
story = open("Story.txt", "r").read()
story_split = story.split("||")
fps = cap.get(cv2.CAP_PROP_FPS)
frame_count = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
video_duration = frame_count / fps  # Duration of one loop of the video
fourcc = cv2.VideoWriter_fourcc(*"mp4v")
audio_duration = len(audio) / 1000  # Duration in seconds
video_writer = cv2.VideoWriter(f"CompletedVideo.mp4", fourcc, fps, (1080, 1920))

choice = 0#part of the story choice
part_split = story_split[choice].split(" ")
with open("Segment.txt", "w") as file:
file.write(story_split[choice])
start_time = time.time()
length = len(part_split) - 1
next_text = []
for j in range(0, length):
temp = part_split[j].replace("\n", "")
next_text.append([temp])
index = 0
word_index = 0
frame_size_x = 1080
frame_size_y = 1920
audio_duration = len(audio) / 1000  # Duration in seconds
start_time = time.time()
wait_time = 1 / fps
while (time.time() - start_time) < audio_duration:
cap.set(cv2.CAP_PROP_POS_FRAMES, 0)  # Restart video
elapsed_time = time.time() - start_time
print(video_writer)
if index >= len(transcription):
break
while cap.isOpened():
# Capture frames in the video
ret, frame = cap.read()
if not ret:
break
audio_frame, val = player.get_frame()
if val == 'eof':  # End of file
print("Audio playback finished.")
break
if index >= len(transcription):
break

if frame_size_x == -1:
frame_size_x = frame.shape[1]
frame_size_y = frame.shape[0]

elapsed_time = time.time() - start_time

# describe the type of font
# to be used.
font = cv2.FONT_HERSHEY_SIMPLEX
trans = transcription[index]["words"]
end_time = trans[word_index]["end"]
if trans[word_index]["start"] < elapsed_time < trans[word_index]["end"]:
video_text = trans[word_index]["text"]
elif elapsed_time >= trans[word_index]["end"]:
#index += 1
word_index += 1
if (word_index >= len(trans)):
index += 1
word_index = 0
# get boundary of this text
textsize = cv2.getTextSize(video_text, font, 3, 6)[0]
# get coords based on boundary
textX = int((frame.shape[1] - textsize[0]) / 2)
textY = int((frame.shape[0] + textsize[1]) / 2)

cv2.putText(frame,
video_text,
(textX, textY),
font, 3,
(0, 255, 255),
6,
cv2.LINE_4)

# Define the resize scale
scale_percent = 50  # Resize to 50% of the original size
# Get new dimensions
width = 1080
height = 1920
new_size = (width, height)

# Resize the frame
resized_frame = cv2.resize(frame, new_size)
video_writer.write(resized_frame)
cv2.imshow('video', resized_frame)
cv2.waitKey(wait_time)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
cv2.destroyAllWindows()
video_writer.release()
cap.release()

[/code]
Когда я запускаю этот скрипт, звук идеально соответствует тексту в видео и работает столько времени, сколько соответствует звуку (2 минуты 44 секунды).  Однако сохраненное видео CompletedVideo.mp4 длится всего 1 минуту 10 секунд. Непонятно, почему видео ускорилось. Фпс составляет 60 кадров в секунду. Если вам нужна дополнительная информация, дайте мне знать и заранее спасибо.
Я пробовал менять частоту кадров, меняя время ожидания после записи каждого кадра. Я ожидаю, что CompletedVideo.mp4 будет длиться 2 минуты 44 секунды, а не 1 минуту 10 секунд. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79312414/why-is-my-mp4-file-created-using-cv2-videowriter-not-syncing-up-with-the-audio[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему мой файл .mp4, созданный с помощью cv2.VideoWriter, не синхронизируется со звуком, когда я объединяю видео и ауди

Последнее сообщение Anonymous « 27 дек 2024, 22:56
Добавлено в форуме Python

Anonymous » 27 дек 2024, 22:56 » в форуме Python

Цель скрипта — взять текст из текстового файла и поместить его в стоковое видео, где текст будет читать искусственный интеллект. Похоже на те истории на Reddit в социальных сетях, где на заднем плане паркур в Майнкрафте.
import cv2
import time
from...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
27 дек 2024, 22:56
Как я могу сохранить видео, созданное с помощью cv2.VideoWriter в Google-Colab, на путь Google Диска?

Последнее сообщение Anonymous « 17 сен 2024, 12:16
Добавлено в форуме Python

Anonymous » 17 сен 2024, 12:16 » в форуме Python

Я пытаюсь каким-то образом скопировать файл «video1.mkv» в папку «моя папка».

Есть способы копирования получше, но мой Обычно я читаю «video1.mkv» и создаю новое видео, используя видео, которое я читал ранее.

Проблема в том, что что я не могу его...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
17 сен 2024, 12:16
Как я могу сохранить видео, созданное с помощью cv2.VideoWriter в Google-Colab, на путь Google Диска?

Последнее сообщение Anonymous « 17 сен 2024, 13:31
Добавлено в форуме Python

Anonymous » 17 сен 2024, 13:31 » в форуме Python

Я пытаюсь каким-то образом скопировать файл «video1.mkv» в папку «моя папка».

Есть способы копирования получше, но мой Обычно я читаю «video1.mkv» и создаю новое видео, используя видео, которое я читал ранее.

Проблема в том, что что я не могу его...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
17 сен 2024, 13:31
Как сохранить видео, созданное с помощью cv2.VideoWriter в Google-Colab, на путь Google Drive?

Последнее сообщение Anonymous « 16 ноя 2024, 19:43
Добавлено в форуме Python

Anonymous » 16 ноя 2024, 19:43 » в форуме Python

Я пытаюсь каким-то образом скопировать файл «video1.mkv» в папку «моя папка».
Есть способы копирования получше, но я предпочитаю читать «video1.mkv». mkv и создать новое видео, используя прочитанное ранее видео.
Проблема в том, что я не могу его...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
16 ноя 2024, 19:43
Cv2.videowriter записывает файл размером 0 байт (python) (opencv)

Последнее сообщение Anonymous « 10 май 2024, 05:43
Добавлено в форуме Python

Anonymous » 10 май 2024, 05:43 » в форуме Python

В настоящее время я работаю над проектом по обнаружению движения, который записывает видео при обнаружении движения. Сейчас при записи видео ошибок нет, но когда я проверяю видео, оно составляет 0 байт. Буду очень признателен за любую помощь.

Это...

0 Ответы

72 Просмотры

Последнее сообщение Anonymous
10 май 2024, 05:43

Вернуться в «Python»