Входные данные учебника convLSTM [закрыто]

Входные данные учебника convLSTM [закрыто] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Входные данные учебника convLSTM [закрыто]

Цитата

Сообщение Anonymous » 05 дек 2024, 22:00

Я нашел следующее руководство «https://medium.com/neuronio-br/uma-intr ... 4abf9ea84a», в котором рассказывается о модели ConvLSTM.
Я создал алгоритм для построения входных данных модели:

Код: Выделить всё

import os
import cv2
import numpy as np
import pandas as pd

# Settings
video_folder = 'train'  # Path to the folder containing videos
output_folder = 'train_npy'  # Folder to save .npy files
csv_file = 'train.csv'  # Path to the CSV file
frames_per_video = 16  # Number of frames per video (time)
pixels_x, pixels_y = 112, 112  # Frame dimensions

# Load the CSV with video names and categories
df = pd.read_csv(csv_file)  # Columns: 'video_name', 'tag'

# Number of classes based on the unique values in the 'tag' column
unique_tags = df['tag'].unique()
num_categories = len(unique_tags)  # Define the number of classes based on the data

# Dictionary to map categories to indices
tag_to_index = {tag: idx for idx, tag in enumerate(unique_tags)}

# Create output folders if they don't exist
os.makedirs(output_folder, exist_ok=True)

# Function to extract and process frames
def extract_frames(video_path, num_frames=16, size=(pixels_x, pixels_y)):
cap = cv2.VideoCapture(video_path)
total_frames = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
frame_interval = max(total_frames // num_frames, 1)

frames = []
for i in range(num_frames):
cap.set(cv2.CAP_PROP_POS_FRAMES, i * frame_interval)
ret, frame = cap.read()
if not ret:
break
frame = cv2.resize(frame, size)
frames.append(frame)

# Fill with zero frames if necessary
while len(frames) < num_frames:
frames.append(np.zeros((pixels_x, pixels_y, 3), dtype=np.uint8))

cap.release()
return np.array(frames)  # Shape: (frames, pixels_x, pixels_y, 3)

# Loop to process all videos
for idx, row in df.iterrows():
video_name = row['video_name']
class_label = row['tag']

# Full path to the video
video_path = os.path.join(video_folder, video_name)

# Check if the video exists
if not os.path.exists(video_path):
print(f"Video {video_name} not found!")
continue

# Process frames and save as .npy
scene_data = extract_frames(video_path, frames_per_video)
scene_data = scene_data.transpose(0, 3, 1, 2)  # Change order to (frames, channels, rows, columns)
np.save(os.path.join(output_folder, f'scene_{idx}.npy'), scene_data)

# Create and save categories (independent outputs)
category_data = np.zeros((num_categories, 1, frames_per_video, 1))
category_data[tag_to_index[class_label], 0, :, 0] = 1  # Mark the category as 1 for all frames
np.save(os.path.join(output_folder, f'category_{idx}.npy'), category_data)

print("Processing completed!")

Однако при обучении модели я получил следующую ошибку:

Код: Выделить всё

ValueError: Arguments `target` and `output` must have the same shape.
Received: target.shape=(None, 1, 16), output.shape=(None, 16, 1)

а фигуры соответствуют уроку:

Код: Выделить всё

scene_0.npy.shape = (16, 3, 112, 112)
category_0.npy.shape = (5, 1, 16, 1)

Почему цель и результат имеют разную форму? Это ошибка руководства или ошибка в формате ввода?

Подробнее здесь: https://stackoverflow.com/questions/792 ... m-tutorial

1733425241

Anonymous

Я нашел следующее руководство «https://medium.com/neuronio-br/uma-introdu%C3%A7%C3%A3o-a-convlstm-c14abf9ea84a», в котором рассказывается о модели ConvLSTM.
Я создал алгоритм для построения входных данных модели:
[code]import os
import cv2
import numpy as np
import pandas as pd

# Settings
video_folder = 'train'  # Path to the folder containing videos
output_folder = 'train_npy'  # Folder to save .npy files
csv_file = 'train.csv'  # Path to the CSV file
frames_per_video = 16  # Number of frames per video (time)
pixels_x, pixels_y = 112, 112  # Frame dimensions

# Load the CSV with video names and categories
df = pd.read_csv(csv_file)  # Columns: 'video_name', 'tag'

# Number of classes based on the unique values in the 'tag' column
unique_tags = df['tag'].unique()
num_categories = len(unique_tags)  # Define the number of classes based on the data

# Dictionary to map categories to indices
tag_to_index = {tag: idx for idx, tag in enumerate(unique_tags)}

# Create output folders if they don't exist
os.makedirs(output_folder, exist_ok=True)

# Function to extract and process frames
def extract_frames(video_path, num_frames=16, size=(pixels_x, pixels_y)):
cap = cv2.VideoCapture(video_path)
total_frames = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
frame_interval = max(total_frames // num_frames, 1)

frames = []
for i in range(num_frames):
cap.set(cv2.CAP_PROP_POS_FRAMES, i * frame_interval)
ret, frame = cap.read()
if not ret:
break
frame = cv2.resize(frame, size)
frames.append(frame)

# Fill with zero frames if necessary
while len(frames) < num_frames:
frames.append(np.zeros((pixels_x, pixels_y, 3), dtype=np.uint8))

cap.release()
return np.array(frames)  # Shape: (frames, pixels_x, pixels_y, 3)

# Loop to process all videos
for idx, row in df.iterrows():
video_name = row['video_name']
class_label = row['tag']

# Full path to the video
video_path = os.path.join(video_folder, video_name)

# Check if the video exists
if not os.path.exists(video_path):
print(f"Video {video_name} not found!")
continue

# Process frames and save as .npy
scene_data = extract_frames(video_path, frames_per_video)
scene_data = scene_data.transpose(0, 3, 1, 2)  # Change order to (frames, channels, rows, columns)
np.save(os.path.join(output_folder, f'scene_{idx}.npy'), scene_data)

# Create and save categories (independent outputs)
category_data = np.zeros((num_categories, 1, frames_per_video, 1))
category_data[tag_to_index[class_label], 0, :, 0] = 1  # Mark the category as 1 for all frames
np.save(os.path.join(output_folder, f'category_{idx}.npy'), category_data)

print("Processing completed!")
[/code]
Однако при обучении модели я получил следующую ошибку:
[code]ValueError: Arguments `target` and `output` must have the same shape.
Received: target.shape=(None, 1, 16), output.shape=(None, 16, 1)
[/code]
а фигуры соответствуют уроку:
[code]scene_0.npy.shape = (16, 3, 112, 112)
category_0.npy.shape = (5, 1, 16, 1)
[/code]
Почему цель и результат имеют разную форму? Это ошибка руководства или ошибка в формате ввода? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79248815/inputs-of-a-convlstm-tutorial[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Входные данные руководства по convLSTM

Последнее сообщение Anonymous « 03 дек 2024, 21:34
Добавлено в форуме Python

Anonymous » 03 дек 2024, 21:34 » в форуме Python

Я нашел следующее руководство « в котором рассказывается о модели ConvLSTM.
Я создал алгоритм для построения входных данных модели:
import os
import cv2
import numpy as np
import pandas as pd

# Settings
video_folder = 'train' # Path to the folder...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
03 дек 2024, 21:34
Входные данные руководства по convLSTM

Последнее сообщение Anonymous « 04 дек 2024, 19:21
Добавлено в форуме Python

Anonymous » 04 дек 2024, 19:21 » в форуме Python

Я нашел следующее руководство « в котором рассказывается о модели ConvLSTM.
Я создал алгоритм для построения входных данных модели:
import os
import cv2
import numpy as np
import pandas as pd

# Settings
video_folder = 'train' # Path to the folder...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
04 дек 2024, 19:21
Как получить все входные данные из запроса Laravel, когда мои входные данные являются динамическими

Последнее сообщение Anonymous « 01 май 2024, 17:39
Добавлено в форуме Php

Anonymous » 01 май 2024, 17:39 » в форуме Php

У меня есть js-скрипт, который действует на мое представление, создавая переменное количество входных данных
inputArray.forEach(input => {
let newRow = document.createElement('div');
newRow.className = 'row';
newRow.innerHTML = `

Campo...

0 Ответы

48 Просмотры

Последнее сообщение Anonymous
01 май 2024, 17:39
Объект FormData получает только входные данные файла, а не другие входные данные, такие как текст.

Последнее сообщение Anonymous « 05 июл 2024, 07:09
Добавлено в форуме Php

Anonymous » 05 июл 2024, 07:09 » в форуме Php

Я новичок в использовании объекта FormData и все еще пытаюсь ознакомиться с тем, как он работает. Итак, мне удалось опубликовать видеофайл в PHP-скрипт, который обрабатывает загрузку/перемещение видеофайла в папку. Однако я не могу передавать или...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
05 июл 2024, 07:09
Объект FormData получает только входные данные файла, а не другие входные данные, такие как текст.

Последнее сообщение Anonymous « 05 июл 2024, 07:09
Добавлено в форуме Jquery

Anonymous » 05 июл 2024, 07:09 » в форуме Jquery

Я новичок в использовании объекта FormData и все еще пытаюсь ознакомиться с тем, как он работает. Итак, мне удалось опубликовать видеофайл в PHP-скрипт, который обрабатывает загрузку/перемещение видеофайла в папку. Однако я не могу передавать или...

0 Ответы

40 Просмотры

Последнее сообщение Anonymous
05 июл 2024, 07:09

Вернуться в «Python»