Повышение точности обучения при колебаниях точности проверки

Повышение точности обучения при колебаниях точности проверки ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Повышение точности обучения при колебаниях точности проверки

Цитата

Сообщение Anonymous » 10 май 2024, 02:24

Я пытаюсь создать модель распознавания действий на языке жестов, у меня есть кадры, которые я преобразовал в ключевые точки ориентиров с помощью Mediapipe, и они находятся в формате .npy, обучение достигает 90 %, но моя проверка достигает 10 %, 20 %, 50%, 20%, 25% и т. д.
Мой набор данных состоит из 502 классов и более 2 миллионов изображений.
Ниже моя модель

Код: Выделить всё

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout, BatchNormalization
from tensorflow.keras.regularizers import l2
from tensorflow.keras.optimizers import Adam

def enhanced_cnn_lstm_model(num_frames=30, num_keypoints=1662, num_classes=502):
model = Sequential()

model.add(LSTM(units=128, return_sequences=True, input_shape=(num_frames, num_keypoints), recurrent_dropout=0.2))
model.add(BatchNormalization())
model.add(Dropout(0.5))

model.add(LSTM(units=256, return_sequences=True))
model.add(BatchNormalization())
model.add(Dropout(0.5))

model.add(LSTM(units=512, return_sequences=False))
model.add(BatchNormalization())
model.add(Dropout(0.5))

model.add(Dense(1024, activation='relu', kernel_regularizer=l2(0.01)))
model.add(Dropout(0.5))

model.add(Dense(num_classes, activation='softmax'))

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

return model

Мой генератор данных

Код: Выделить всё

from tensorflow.keras.utils import Sequence
import tensorflow as tf
import numpy as np
import os

tf.config.run_functions_eagerly(True)
class KeypointsDataGenerator(Sequence):
def __init__(self, dataset_dir, batch_size=64, shuffle=True, num_frames=30, num_keypoints=1662):
self.dataset_dir = dataset_dir
self.batch_size = batch_size
self.shuffle = shuffle
self.num_frames = num_frames
self.num_keypoints = num_keypoints
self.samples, self.labels = self._load_dataset()
self.on_epoch_end()

def _load_dataset(self):
samples = []
labels = {}
label_idx = 0
for label_dir in sorted(os.listdir(self.dataset_dir)):
label_path = os.path.join(self.dataset_dir, label_dir)
for sample_file in sorted(os.listdir(label_path)):
sample_path = os.path.join(label_path, sample_file)
if os.path.isfile(sample_path) and sample_path.endswith('.npy'):
samples.append(sample_path)
labels[sample_path] = label_idx
label_idx += 1
if not samples:
print("No samples found.")
return samples, labels

def __len__(self):
return int(np.floor(len(self.samples) / self.batch_size))

def __getitem__(self, index):
batch_samples = self.samples[index * self.batch_size:(index + 1) * self.batch_size]
X, y = self._generate_data(batch_samples)
return X, y

def _generate_data(self, batch_samples):
X = np.zeros((self.batch_size, self.num_frames, self.num_keypoints))
y = np.zeros((self.batch_size), dtype=int)

for i, sample_path in enumerate(batch_samples):
keypoints = np.load(sample_path)
keypoints = keypoints.reshape(self.num_frames, self.num_keypoints)
X[i,] = keypoints
y[i] = self.labels[sample_path]

return X, tf.keras.utils.to_categorical(y, num_classes=502)

def on_epoch_end(self):
if self.shuffle:
np.random.shuffle(self.samples)

Код, используемый для извлечения ключевых точек

Код: Выделить всё

import numpy as np

def adjust_sequence_length(features_list, target_length=30):
uniform_length = max(len(f) for f in features_list) if features_list else 0

padded_features_list = [np.pad(f, (0, uniform_length - len(f)), 'constant') for f in features_list]

num_frames = len(padded_features_list)
adjusted_features = np.zeros((target_length, uniform_length))

if num_frames > target_length:
indices = np.round(np.linspace(0, num_frames - 1, target_length)).astype(int)
adjusted_features = np.array(padded_features_list)[indices]

elif num_frames <  target_length:
repeat_factor = target_length // num_frames
additional_frames_needed = target_length % num_frames
expanded_features = padded_features_list * repeat_factor + padded_features_list[:additional_frames_needed]
adjusted_features[:len(expanded_features), :] = expanded_features

else:
adjusted_features = np.array(padded_features_list)

return adjusted_features

mp_hands = mp.solutions.hands.Hands(static_image_mode=True, max_num_hands=2, min_detection_confidence=0.5)
mp_pose = mp.solutions.pose.Pose(static_image_mode=True, min_detection_confidence=0.5)
mp_face_mesh = mp.solutions.face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1, min_detection_confidence=0.5)

for label_dir in tqdm(os.listdir(dataset_directory)):
gesture_path = os.path.join(dataset_directory, label_dir)
features_label_dir = os.path.join(features_root_directory, label_dir)
os.makedirs(features_label_dir, exist_ok=True)
for sample_dir in os.listdir(gesture_path):
sample_path = os.path.join(gesture_path, sample_dir)
features_list = []

for frame in sorted(os.listdir(sample_path)):
image_path = os.path.join(sample_path, frame)
image = cv2.imread(image_path)
if image is not None:
image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
features = extract_features(image_rgb, mp_hands, mp_pose, mp_face_mesh)
if features.size >  0:
features_list.append(features)

adjusted_features = adjust_sequence_length(features_list)

save_path = os.path.join(features_label_dir, f"{sample_dir}.npy")
np.save(save_path, adjusted_features)

mp_hands.close()
mp_pose.close()
mp_face_mesh.close()

Я попробовал генератор данных с помощью normailztion, но точность обучения застряла на уровне 0,2%

Код: Выделить всё

from tensorflow.keras.utils import Sequence
import tensorflow as tf
import numpy as np
import os

tf.config.run_functions_eagerly(True)
class KeypointsDataGenerator(Sequence):
def __init__(self, dataset_dir, batch_size=32, shuffle=True, num_frames=30, num_keypoints=1662):
self.dataset_dir = dataset_dir
self.batch_size = batch_size
self.shuffle = shuffle
self.num_frames = num_frames
self.num_keypoints = num_keypoints
self.samples, self.labels = self._load_dataset()
self.min_val, self.max_val = self._find_min_max_values()
self.on_epoch_end()

def _load_dataset(self):
samples = []
labels = {}
label_idx = 0
for label_dir in sorted(os.listdir(self.dataset_dir)):
print(f'Processing label: {label_dir}')
label_path = os.path.join(self.dataset_dir, label_dir)
for sample_file in sorted(os.listdir(label_path)):
sample_path = os.path.join(label_path, sample_file)
if os.path.isfile(sample_path) and sample_path.endswith('.npy'):
samples.append(sample_path)
labels[sample_path] = label_idx
label_idx += 1
return samples, labels

def __len__(self):
return int(np.floor(len(self.samples) / self.batch_size))

def __getitem__(self, index):
batch_samples = self.samples[index * self.batch_size:(index + 1) * self.batch_size]
X, y = self._generate_data(batch_samples)
return X, y

def _find_min_max_values(self):
min_vals = []
max_vals = []
for sample_path in self.samples:
print(f'Processing sample: {sample_path}')
keypoints = np.load(sample_path)
min_vals.append(np.min(keypoints))
max_vals.append(np.max(keypoints))
return np.min(min_vals), np.max(max_vals)

def _generate_data(self, batch_samples):
X = np.zeros((self.batch_size, self.num_frames, self.num_keypoints))
y = np.zeros((self.batch_size), dtype=int)
for i, sample_path in enumerate(batch_samples):
keypoints = np.load(sample_path)
keypoints = keypoints.reshape(self.num_frames, self.num_keypoints)
keypoints = (keypoints - self.min_val) / (self.max_val - self.min_val)  # Apply Min-Max scaling
X[i,] = keypoints
y[i] = self.labels[sample_path]
return X, tf.keras.utils.to_categorical(y, num_classes=502)

def on_epoch_end(self):
if self.shuffle:
np.random.shuffle(self.samples)

Я попробовал снизить процент отсева, но все тот же, сделал модель все менее и более сложной, я попробовал другую скорость обучения, но все равно ничего не помогло.

Подробнее здесь: https://stackoverflow.com/questions/784 ... luctuating

1715297080

Anonymous

Я пытаюсь создать модель распознавания действий на языке жестов, у меня есть кадры, которые я преобразовал в ключевые точки ориентиров с помощью Mediapipe, и они находятся в формате .npy, обучение достигает 90 %, но моя проверка достигает 10 %, 20 %, 50%, 20%, 25% и т. д.
Мой набор данных состоит из 502 классов и более 2 миллионов изображений.
Ниже моя модель
[code]from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout, BatchNormalization
from tensorflow.keras.regularizers import l2
from tensorflow.keras.optimizers import Adam

def enhanced_cnn_lstm_model(num_frames=30, num_keypoints=1662, num_classes=502):
model = Sequential()

model.add(LSTM(units=128, return_sequences=True, input_shape=(num_frames, num_keypoints), recurrent_dropout=0.2))
model.add(BatchNormalization())
model.add(Dropout(0.5))

model.add(LSTM(units=256, return_sequences=True))
model.add(BatchNormalization())
model.add(Dropout(0.5))

model.add(LSTM(units=512, return_sequences=False))
model.add(BatchNormalization())
model.add(Dropout(0.5))

model.add(Dense(1024, activation='relu', kernel_regularizer=l2(0.01)))
model.add(Dropout(0.5))

model.add(Dense(num_classes, activation='softmax'))

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

return model

[/code]
Мой генератор данных
[code]from tensorflow.keras.utils import Sequence
import tensorflow as tf
import numpy as np
import os

tf.config.run_functions_eagerly(True)
class KeypointsDataGenerator(Sequence):
def __init__(self, dataset_dir, batch_size=64, shuffle=True, num_frames=30, num_keypoints=1662):
self.dataset_dir = dataset_dir
self.batch_size = batch_size
self.shuffle = shuffle
self.num_frames = num_frames
self.num_keypoints = num_keypoints
self.samples, self.labels = self._load_dataset()
self.on_epoch_end()

def _load_dataset(self):
samples = []
labels = {}
label_idx = 0
for label_dir in sorted(os.listdir(self.dataset_dir)):
label_path = os.path.join(self.dataset_dir, label_dir)
for sample_file in sorted(os.listdir(label_path)):
sample_path = os.path.join(label_path, sample_file)
if os.path.isfile(sample_path) and sample_path.endswith('.npy'):
samples.append(sample_path)
labels[sample_path] = label_idx
label_idx += 1
if not samples:
print("No samples found.")
return samples, labels

def __len__(self):
return int(np.floor(len(self.samples) / self.batch_size))

def __getitem__(self, index):
batch_samples = self.samples[index * self.batch_size:(index + 1) * self.batch_size]
X, y = self._generate_data(batch_samples)
return X, y

def _generate_data(self, batch_samples):
X = np.zeros((self.batch_size, self.num_frames, self.num_keypoints))
y = np.zeros((self.batch_size), dtype=int)

for i, sample_path in enumerate(batch_samples):
keypoints = np.load(sample_path)
keypoints = keypoints.reshape(self.num_frames, self.num_keypoints)
X[i,] = keypoints
y[i] = self.labels[sample_path]

return X, tf.keras.utils.to_categorical(y, num_classes=502)

def on_epoch_end(self):
if self.shuffle:
np.random.shuffle(self.samples)

[/code]
Код, используемый для извлечения ключевых точек
[code]import numpy as np

def adjust_sequence_length(features_list, target_length=30):
uniform_length = max(len(f) for f in features_list) if features_list else 0

padded_features_list = [np.pad(f, (0, uniform_length - len(f)), 'constant') for f in features_list]

num_frames = len(padded_features_list)
adjusted_features = np.zeros((target_length, uniform_length))

if num_frames > target_length:
indices = np.round(np.linspace(0, num_frames - 1, target_length)).astype(int)
adjusted_features = np.array(padded_features_list)[indices]

elif num_frames <  target_length:
repeat_factor = target_length // num_frames
additional_frames_needed = target_length % num_frames
expanded_features = padded_features_list * repeat_factor + padded_features_list[:additional_frames_needed]
adjusted_features[:len(expanded_features), :] = expanded_features

else:
adjusted_features = np.array(padded_features_list)

return adjusted_features

mp_hands = mp.solutions.hands.Hands(static_image_mode=True, max_num_hands=2, min_detection_confidence=0.5)
mp_pose = mp.solutions.pose.Pose(static_image_mode=True, min_detection_confidence=0.5)
mp_face_mesh = mp.solutions.face_mesh.FaceMesh(static_image_mode=True, max_num_faces=1, min_detection_confidence=0.5)

for label_dir in tqdm(os.listdir(dataset_directory)):
gesture_path = os.path.join(dataset_directory, label_dir)
features_label_dir = os.path.join(features_root_directory, label_dir)
os.makedirs(features_label_dir, exist_ok=True)
for sample_dir in os.listdir(gesture_path):
sample_path = os.path.join(gesture_path, sample_dir)
features_list = []

for frame in sorted(os.listdir(sample_path)):
image_path = os.path.join(sample_path, frame)
image = cv2.imread(image_path)
if image is not None:
image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
features = extract_features(image_rgb, mp_hands, mp_pose, mp_face_mesh)
if features.size >  0:
features_list.append(features)

adjusted_features = adjust_sequence_length(features_list)

save_path = os.path.join(features_label_dir, f"{sample_dir}.npy")
np.save(save_path, adjusted_features)

mp_hands.close()
mp_pose.close()
mp_face_mesh.close()
[/code]
Я попробовал генератор данных с помощью normailztion, но точность обучения застряла на уровне 0,2%
[code]from tensorflow.keras.utils import Sequence
import tensorflow as tf
import numpy as np
import os

tf.config.run_functions_eagerly(True)
class KeypointsDataGenerator(Sequence):
def __init__(self, dataset_dir, batch_size=32, shuffle=True, num_frames=30, num_keypoints=1662):
self.dataset_dir = dataset_dir
self.batch_size = batch_size
self.shuffle = shuffle
self.num_frames = num_frames
self.num_keypoints = num_keypoints
self.samples, self.labels = self._load_dataset()
self.min_val, self.max_val = self._find_min_max_values()
self.on_epoch_end()

def _load_dataset(self):
samples = []
labels = {}
label_idx = 0
for label_dir in sorted(os.listdir(self.dataset_dir)):
print(f'Processing label: {label_dir}')
label_path = os.path.join(self.dataset_dir, label_dir)
for sample_file in sorted(os.listdir(label_path)):
sample_path = os.path.join(label_path, sample_file)
if os.path.isfile(sample_path) and sample_path.endswith('.npy'):
samples.append(sample_path)
labels[sample_path] = label_idx
label_idx += 1
return samples, labels

def __len__(self):
return int(np.floor(len(self.samples) / self.batch_size))

def __getitem__(self, index):
batch_samples = self.samples[index * self.batch_size:(index + 1) * self.batch_size]
X, y = self._generate_data(batch_samples)
return X, y

def _find_min_max_values(self):
min_vals = []
max_vals = []
for sample_path in self.samples:
print(f'Processing sample: {sample_path}')
keypoints = np.load(sample_path)
min_vals.append(np.min(keypoints))
max_vals.append(np.max(keypoints))
return np.min(min_vals), np.max(max_vals)

def _generate_data(self, batch_samples):
X = np.zeros((self.batch_size, self.num_frames, self.num_keypoints))
y = np.zeros((self.batch_size), dtype=int)
for i, sample_path in enumerate(batch_samples):
keypoints = np.load(sample_path)
keypoints = keypoints.reshape(self.num_frames, self.num_keypoints)
keypoints = (keypoints - self.min_val) / (self.max_val - self.min_val)  # Apply Min-Max scaling
X[i,] = keypoints
y[i] = self.labels[sample_path]
return X, tf.keras.utils.to_categorical(y, num_classes=502)

def on_epoch_end(self):
if self.shuffle:
np.random.shuffle(self.samples)
[/code]
Я попробовал снизить процент отсева, но все тот же, сделал модель все менее и более сложной, я попробовал другую скорость обучения, но все равно ничего не помогло. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78457299/training-accuracy-raising-while-validation-accuracy-fluctuating[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Невозможно получить точность обучения, потери обучения, точность проверки, график потерь проверки модели SentenceTransfo

Последнее сообщение Anonymous « 26 янв 2025, 21:07
Добавлено в форуме Python

Anonymous » 26 янв 2025, 21:07 » в форуме Python

Я создаваю модель Seedencetransformer ('All-Minilm-L6-V2'), используя словарь (JSON) с названием Category_Descriptions в качестве набора данных.
Ниже приведен Структура данных Category_descriptions ：
{
CategoryA : {
CategorySearch : Description...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
26 янв 2025, 21:07
Невозможно получить точность обучения, потерю обучения, точность проверки, график потери проверки модели SEDENCETRANSFOR

Последнее сообщение Anonymous « 26 янв 2025, 23:04
Добавлено в форуме Python

Anonymous » 26 янв 2025, 23:04 » в форуме Python

Я создаваю модель Seedencetransformer ('All-Minilm-L6-V2'), используя словарь (JSON) с названием Category_Descriptions в качестве набора данных.
Ниже приведен Структура данных Category_descriptions ：
{
CategoryA : {
CategorySearch : Description...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
26 янв 2025, 23:04
Повышение точности сегментации семантического изображения на спутниковых снимках диаметром 25 см [закрыто]

Последнее сообщение Гость « 21 сен 2023, 14:45
Добавлено в форуме Python

Гость » 21 сен 2023, 14:45 » в форуме Python

Я пытаюсь выполнить семантическую сегментацию изображений на спутниковых снимках высокого разрешения (25 см) для классификации земного покрова. Я уже пытался использовать предварительно обученную модель U-Net с магистралью ResNet34, но столкнулся с...

0 Ответы

33 Просмотры

Последнее сообщение Гость
21 сен 2023, 14:45
Повышение точности целочисленного умножения и деления для экспоненциального скользящего среднего.

Последнее сообщение Anonymous « 08 дек 2023, 12:05
Добавлено в форуме C++

Anonymous » 08 дек 2023, 12:05 » в форуме C++

Мне нужно сгладить 16-битные значения (показания АЦП микроконтроллера STM32). Используемая функция должна быть быстрой и выполнять только целочисленные вычисления (она запускается в обработчике прерываний). Хотя экспоненциальное скользящее среднее...

0 Ответы

58 Просмотры

Последнее сообщение Anonymous
08 дек 2023, 12:05
Повышение точности целочисленного умножения и деления для экспоненциального скользящего среднего.

Последнее сообщение Гость « 08 дек 2023, 14:15
Добавлено в форуме C++

Гость » 08 дек 2023, 14:15 » в форуме C++

Мне нужно сгладить 16-битные значения (показания АЦП микроконтроллера STM32). Используемая функция должна быть быстрой и выполнять только целочисленные вычисления (она запускается в обработчике прерываний). Хотя экспоненциальное скользящее среднее...

0 Ответы

80 Просмотры

Последнее сообщение Гость
08 дек 2023, 14:15

Вернуться в «Python»