CNN Model Learning неправильно возвращает значения экстремальных

CNN Model Learning неправильно возвращает значения экстремальных ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

CNN Model Learning неправильно возвращает значения экстремальных

Цитата

Сообщение Anonymous » 25 фев 2025, 13:57

Я работал над моделью CNN обнаружения бинарных объектов, используя Transfer Learning с встроенной моделью Resnet 50. Однако после нескольких раз тренировки более 100 эпох он возвращает координаты 0,0,0,1, что переводит XMIN, YMIN и XMAX = 0 и Y MAX = 300. Входные изображения, которые он при получении имеет форму (размер партии, 300,300,3), этикетки обрабатываются и находятся в форме (размер партии, 4) и нормализованы между 0 и 1, и, наконец, категориальные этикетки имеют форму (размер партии, 2) и одну горячую кодировку. Ниже приведена архитектура модели. < /P>
from tensorflow.keras import layers
from tensorflow.keras import models
from keras.applications.resnet50 import ResNet50

res = ResNet50(weights ='imagenet', include_top = False,
input_shape =(300, 300, 3))
x = res.output
x = layers.MaxPooling2D((2, 2))(x)

# Flatten and Fully connected layers

x = layers.BatchNormalization()(x)

x = layers.Flatten()(x)
x = layers.Dropout(0.5)(x)
x = layers.Dense(512, activation='relu')(x)
x = layers.BatchNormalization()(x)
x = layers.Dropout(0.50)(x)
x = layers.Dense(512)(x)

# Output layers with proper names
bbox_output = layers.Dense(4, activation='sigmoid', name='bbox_output')(x) # Bounding box output
class_output = layers.Dense(2, activation='softmax', name='class_output')(x) # Class output

# Define the model
model = models.Model(inputs = res.input, outputs=[bbox_output, class_output])

model.compile(
optimizer='Adam',
loss={'bbox_output': diou_loss, 'class_output': 'categorical_crossentropy'},
metrics={'bbox_output': 'MSE', 'class_output': 'accuracy'})

callbacks = [
keras.callbacks.EarlyStopping(
# Stop training when `val_loss` is no longer improving
monitor='val_bbox_output_loss',
# "no longer improving" being defined as "no better than 1e-2 less"
min_delta=1e-2,
# "no longer improving" being further defined as "for at least 2 epochs"
patience=20,
verbose=1,
)]

history = model.fit(X,
[bbox_labels,class_labels],
epochs=100,batch_size=50,
verbose=1,
validation_data=(X_test,[bbox_labels_test,class_labels_test]),
callbacks=callbacks)
< /code>
Ниже приведена функция потери Diou: < /p>
def diou_loss(y_true, y_pred, epsilon=1e-7):
# Use fixed image dimensions (256x256)

print('yt',y_true)
print('yp',y_pred)

x_min_inter = tf.maximum(y_true[..., 0], y_pred[..., 0])
y_min_inter = tf.maximum(y_true[..., 1], y_pred[..., 1])
x_max_inter = tf.minimum(y_true[..., 2], y_pred[..., 2])
y_max_inter = tf.minimum(y_true[..., 3], y_pred[..., 3])

inter_area = tf.maximum(0.0, x_max_inter - x_min_inter) * tf.maximum(0.0, y_max_inter - y_min_inter)
print('ia',inter_area)
true_area = tf.maximum(0.0, y_true[..., 2] - y_true[..., 0]) * tf.maximum(0.0, y_true[..., 3] - y_true[..., 1])
pred_area = tf.maximum(0.0, y_pred[..., 2] - y_pred[..., 0]) * tf.maximum(0.0, y_pred[..., 3] - y_pred[..., 1])
union_area = true_area + pred_area - inter_area
print('ua',union_area)
iou = inter_area / tf.maximum(union_area, epsilon)
print('iou',iou)

# Calculate the center coordinates of the true and predicted boxes
true_center_x = (y_true[..., 0] + y_true[..., 2]) / 2.0
true_center_y = (y_true[..., 1] + y_true[..., 3]) / 2.0
pred_center_x = (y_pred[..., 0] + y_pred[..., 2]) / 2.0
pred_center_y = (y_pred[..., 1] + y_pred[..., 3]) / 2.0

# Calculate the squared Euclidean distance between the centers
center_distance = (true_center_x - pred_center_x) ** 2 + (true_center_y - pred_center_y) ** 2
print('cd',center_distance)
# Calculate the coordinates of the smallest enclosing box
x_min_enclosing = tf.minimum(y_true[..., 0], y_pred[..., 0])
y_min_enclosing = tf.minimum(y_true[..., 1], y_pred[..., 1])
x_max_enclosing = tf.maximum(y_true[..., 2], y_pred[..., 2])
y_max_enclosing = tf.maximum(y_true[..., 3], y_pred[..., 3])

# Calculate the diagonal length squared of the enclosing box
enclosing_diagonal = (x_max_enclosing - x_min_enclosing) ** 2 + (y_max_enclosing - y_min_enclosing) ** 2
print('ed',enclosing_diagonal)
# Calculate the DIoU

# Return the DIoU loss
return 1.0 - iou + ((center_distance) / tf.maximum(enclosing_diagonal, 1e-7))
< /code>
Я попытался переключить функцию потерь на MSE, но у него все еще есть та же проблема, поэтому я не думаю, что это функция потери. Когда я печатаю bbox_labels, он дает массив с каждой строкой, которая выглядит примерно так:
n0.74666667 0,32333333 0,88333333 0,69]

Подробнее здесь: https://stackoverflow.com/questions/794 ... ema-values

1740481029

Anonymous

 Я работал над моделью CNN обнаружения бинарных объектов, используя Transfer Learning с встроенной моделью Resnet 50. Однако после нескольких раз тренировки более 100 эпох он возвращает координаты 0,0,0,1, что переводит XMIN, YMIN и XMAX = 0 и Y MAX = 300. Входные изображения, которые он при получении имеет форму (размер партии, 300,300,3), этикетки обрабатываются и находятся в форме (размер партии, 4) и нормализованы между 0 и 1, и, наконец, категориальные этикетки имеют форму (размер партии, 2) и одну горячую кодировку. Ниже приведена архитектура модели.  < /P>
from tensorflow.keras import layers
from tensorflow.keras import models
from keras.applications.resnet50 import ResNet50

res = ResNet50(weights ='imagenet', include_top = False,
input_shape =(300, 300, 3))
x = res.output
x = layers.MaxPooling2D((2, 2))(x)

# Flatten and Fully connected layers

x = layers.BatchNormalization()(x)

x = layers.Flatten()(x)
x = layers.Dropout(0.5)(x)
x = layers.Dense(512, activation='relu')(x)
x = layers.BatchNormalization()(x)
x = layers.Dropout(0.50)(x)
x = layers.Dense(512)(x)

# Output layers with proper names
bbox_output = layers.Dense(4, activation='sigmoid', name='bbox_output')(x)  # Bounding box output
class_output = layers.Dense(2, activation='softmax', name='class_output')(x)  # Class output

# Define the model
model = models.Model(inputs = res.input, outputs=[bbox_output, class_output])

model.compile(
optimizer='Adam',
loss={'bbox_output': diou_loss, 'class_output': 'categorical_crossentropy'},
metrics={'bbox_output': 'MSE', 'class_output': 'accuracy'})

callbacks = [
keras.callbacks.EarlyStopping(
# Stop training when `val_loss` is no longer improving
monitor='val_bbox_output_loss',
# "no longer improving" being defined as "no better than 1e-2 less"
min_delta=1e-2,
# "no longer improving" being further defined as "for at least 2 epochs"
patience=20,
verbose=1,
)]

history = model.fit(X,
[bbox_labels,class_labels],
epochs=100,batch_size=50,
verbose=1,
validation_data=(X_test,[bbox_labels_test,class_labels_test]),
callbacks=callbacks)
< /code>
Ниже приведена функция потери Diou: < /p>
def diou_loss(y_true, y_pred, epsilon=1e-7):
# Use fixed image dimensions (256x256)

print('yt',y_true)
print('yp',y_pred)

x_min_inter = tf.maximum(y_true[..., 0], y_pred[..., 0])
y_min_inter = tf.maximum(y_true[..., 1], y_pred[..., 1])
x_max_inter = tf.minimum(y_true[..., 2], y_pred[..., 2])
y_max_inter = tf.minimum(y_true[..., 3], y_pred[..., 3])

inter_area = tf.maximum(0.0, x_max_inter - x_min_inter) * tf.maximum(0.0, y_max_inter - y_min_inter)
print('ia',inter_area)
true_area = tf.maximum(0.0, y_true[..., 2] - y_true[..., 0]) * tf.maximum(0.0, y_true[..., 3] - y_true[..., 1])
pred_area = tf.maximum(0.0, y_pred[..., 2] - y_pred[..., 0]) * tf.maximum(0.0, y_pred[..., 3] - y_pred[..., 1])
union_area = true_area + pred_area - inter_area
print('ua',union_area)
iou = inter_area / tf.maximum(union_area, epsilon)
print('iou',iou)

# Calculate the center coordinates of the true and predicted boxes
true_center_x = (y_true[..., 0] + y_true[..., 2]) / 2.0
true_center_y = (y_true[..., 1] + y_true[..., 3]) / 2.0
pred_center_x = (y_pred[..., 0] + y_pred[..., 2]) / 2.0
pred_center_y = (y_pred[..., 1] + y_pred[..., 3]) / 2.0

# Calculate the squared Euclidean distance between the centers
center_distance = (true_center_x - pred_center_x) ** 2 + (true_center_y - pred_center_y) ** 2
print('cd',center_distance)
# Calculate the coordinates of the smallest enclosing box
x_min_enclosing = tf.minimum(y_true[..., 0], y_pred[..., 0])
y_min_enclosing = tf.minimum(y_true[..., 1], y_pred[..., 1])
x_max_enclosing = tf.maximum(y_true[..., 2], y_pred[..., 2])
y_max_enclosing = tf.maximum(y_true[..., 3], y_pred[..., 3])

# Calculate the diagonal length squared of the enclosing box
enclosing_diagonal = (x_max_enclosing - x_min_enclosing) ** 2 + (y_max_enclosing - y_min_enclosing) ** 2
print('ed',enclosing_diagonal)
# Calculate the DIoU

# Return the DIoU loss
return 1.0 - iou  + ((center_distance) / tf.maximum(enclosing_diagonal, 1e-7))
< /code>
Я попытался переключить функцию потерь на MSE, но у него все еще есть та же проблема, поэтому я не думаю, что это функция потери. Когда я печатаю bbox_labels, он дает массив с каждой строкой, которая выглядит примерно так: 
n0.74666667 0,32333333 0,88333333 0,69]  

Подробнее здесь: [url]https://stackoverflow.com/questions/79466285/cnn-model-learning-improperly-returning-extrema-values[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Разница между входной формой для 1D CNN, 2D CNN и 3D CNN

Последнее сообщение Anonymous « 21 июл 2025, 09:35
Добавлено в форуме Python

Anonymous » 21 июл 2025, 09:35 » в форуме Python

Я впервые создаю модель CNN для классификации изображений, и я немного запутался в том, что будет формой ввода для каждого типа (1D CNN, 2D CNN, 3D CNN) и как исправить количество фильтров в слое свертки. Мои данные - 100x100x30, где 30 являются...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
21 июл 2025, 09:35
Как исправить ошибку: «base_model.model.model.model.embed_tokens» означает при использовании peftModel в Python? (FinGPT

Последнее сообщение Anonymous « 15 июл 2024, 01:36
Добавлено в форуме Python

Anonymous » 15 июл 2024, 01:36 » в форуме Python

Я пытаюсь использовать пример кода из FinGPTForecaster. Я создал токен Huggingface и вошел в Huggingface из строки cmd (Windows 11). Пример кода, скопированный с
Воспроизведенный здесь пример кода выглядит следующим образом:
from datasets import...

0 Ответы

109 Просмотры

Последнее сообщение Anonymous
15 июл 2024, 01:36
Объединение 1D-CNN и 2D-CNN

Последнее сообщение Anonymous « 29 окт 2024, 03:07
Добавлено в форуме Python

Anonymous » 29 окт 2024, 03:07 » в форуме Python

Я хочу построить объединенную модель CNN, используя 1D и 2D CNN, но я пробовал много способов ее создания, но этот сработал, но я не знаю, почему я получаю эту ошибку при использовании model_combined.summary().
Я приложил два изображения, которые...

0 Ответы

37 Просмотры

Последнее сообщение Anonymous
29 окт 2024, 03:07
Выбор значений экстремальных температур из столбца фрейма данных pandas, где процесс выбора включает в себя несколько ус

Последнее сообщение Anonymous « 09 май 2024, 19:47
Добавлено в форуме Python

Anonymous » 09 май 2024, 19:47 » в форуме Python

Имейте набор данных о погоде, который включает дневную максимальную температуру в градусах Цельсия в кадре данных pandas, который так же прост, как дата, и дневная максимальная температура (округленная до десятого значения). Вот пример набора...

0 Ответы

37 Просмотры

Последнее сообщение Anonymous
09 май 2024, 19:47
Убивают ли приложения WatchOS при экстремальных температурах? [закрыто]

Последнее сообщение Anonymous « 19 май 2024, 18:12
Добавлено в форуме IOS

Anonymous » 19 май 2024, 18:12 » в форуме IOS

Я заметил, что мое приложение Apple Watch время от времени случайно закрывается. Это не сбой, и мне не удалось воспроизвести это в контролируемых настройках. Единственное, что я заметил, это то, что это всегда происходит в очень жаркую или очень...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
19 май 2024, 18:12

Вернуться в «Python»