Индексирование выходной сетки CNN в функции потерь

Индексирование выходной сетки CNN в функции потерь ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Индексирование выходной сетки CNN в функции потерь

Цитата

Сообщение Anonymous » 26 дек 2024, 10:42

У меня есть модель CNN, построенная в тензорном потоке, которая выводит сетку с формой (batch_size,H,W,1).
Я выполняю сигмовидную функцию активации для каждой ячейки в сетке.
мой y_true является тензором с [ColIndex,RowIndex,Outcome], что означает, что для каждого экземпляра обучения у меня есть ровно 1 ячейка со значением результата.
Я хочу рассчитать потери при обучении только для 1 ячейку в y_true, что означает, что мне нужно проиндексировать выходные данные сетки в эту 1 ячейку, вычислить логарифмические потери и использовать эту потерю 1 ячейки при обучении.
Я искал решения, но это не так. нашел один, в настоящее время мне удалось создать потерю, которую обучает модель, но потеря почти всегда равна 0, и я получаю странные результаты.
моя функция потерь:

Код: Выделить всё

def custom_target_location_loss(y_true, y_pred):

# Extract column indices, row indices, and values
col_indices = tf.cast(y_true[:,0], tf.int32)  # Column indices
row_indices = tf.cast(y_true[:,1], tf.int32)  # Row indices
values = tf.cast(y_true[:, 2], tf.float32)     # Binary labels (0 or 1)

batch_size = tf.shape(y_pred)[0]
batch_indices = tf.range(batch_size)
channel_indices = tf.zeros_like(batch_indices, dtype=tf.int32)
indices = tf.stack([batch_indices,row_indices, col_indices,channel_indices], axis=1)

y_pred_cell = tf.gather_nd(y_pred, indices)

loss = tf.keras.losses.binary_crossentropy(values, y_pred_cell)

# Return the mean loss across the batch
return tf.reduce_mean(loss)

я что-то упустил?

Подробнее здесь: https://stackoverflow.com/questions/793 ... s-function

1735198964

Anonymous

У меня есть модель CNN, построенная в тензорном потоке, которая выводит сетку с формой (batch_size,H,W,1).
Я выполняю сигмовидную функцию активации для каждой ячейки в сетке.
мой y_true является тензором с [ColIndex,RowIndex,Outcome], что означает, что для каждого экземпляра обучения у меня есть ровно 1 ячейка со значением результата.
Я хочу рассчитать потери при обучении только для 1 ячейку в y_true, что означает, что мне нужно проиндексировать выходные данные сетки в эту 1 ячейку, вычислить логарифмические потери и использовать эту потерю 1 ячейки при обучении.
Я искал решения, но это не так. нашел один, в настоящее время мне удалось создать потерю, которую обучает модель, но потеря почти всегда равна 0, и я получаю странные результаты.
моя функция потерь:
[code]def custom_target_location_loss(y_true, y_pred):

# Extract column indices, row indices, and values
col_indices = tf.cast(y_true[:,0], tf.int32)  # Column indices
row_indices = tf.cast(y_true[:,1], tf.int32)  # Row indices
values = tf.cast(y_true[:, 2], tf.float32)     # Binary labels (0 or 1)

batch_size = tf.shape(y_pred)[0]
batch_indices = tf.range(batch_size)
channel_indices = tf.zeros_like(batch_indices, dtype=tf.int32)
indices = tf.stack([batch_indices,row_indices, col_indices,channel_indices], axis=1)

y_pred_cell = tf.gather_nd(y_pred, indices)

loss = tf.keras.losses.binary_crossentropy(values, y_pred_cell)

# Return the mean loss across the batch
return tf.reduce_mean(loss)
[/code]
я что-то упустил? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79308948/indexing-cnn-output-grid-in-loss-function[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Индексирование выходной сетки CNN в функции потерь

Последнее сообщение Anonymous « 27 дек 2024, 08:22
Добавлено в форуме Python

Anonymous » 27 дек 2024, 08:22 » в форуме Python

У меня есть модель CNN, построенная в тензорном потоке, которая выводит сетку с формой (batch_size,H,W,1).
Я выполняю функцию активации сигмовидной формы для каждой ячейки в Grid.
мой y_true является тензорным с , что означает, что для каждого...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
27 дек 2024, 08:22
Разница между входной формой для 1D CNN, 2D CNN и 3D CNN

Последнее сообщение Anonymous « 21 июл 2025, 09:35
Добавлено в форуме Python

Anonymous » 21 июл 2025, 09:35 » в форуме Python

Я впервые создаю модель CNN для классификации изображений, и я немного запутался в том, что будет формой ввода для каждого типа (1D CNN, 2D CNN, 3D CNN) и как исправить количество фильтров в слое свертки. Мои данные - 100x100x30, где 30 являются...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
21 июл 2025, 09:35
Объединение пользовательской функции потерь с предопределенной функцией потерь (Dice и Focal) для обучения DeeplabV3Plus

Последнее сообщение Anonymous « 19 окт 2023, 10:37
Добавлено в форуме Python

Anonymous » 19 окт 2023, 10:37 » в форуме Python

Я обучаю DeeplabV3+ семантической сегментации изображений дистанционного зондирования. Я создаю модель после урока по keras ( ), и она отлично работает, когда я использую для обучения фокусную потерю (предустановленную в Keras/tf). Маски имеют...

0 Ответы

51 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 10:37
Функция потерь не уменьшается в модели CNN?

Последнее сообщение Anonymous « 06 июл 2024, 13:41
Добавлено в форуме Python

Anonymous » 06 июл 2024, 13:41 » в форуме Python

Я создаю модель CNN для обнаружения эмоций (я новичок в создании нейронных сетей). Используемый мной набор данных имел следующую структуру:
DatasetName ->
train ->
0
1
2
34
5
6
7
где каждое число представляло собой папку данных для отдельной эмоции....

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
06 июл 2024, 13:41
Объединение 1D-CNN и 2D-CNN

Последнее сообщение Anonymous « 29 окт 2024, 03:07
Добавлено в форуме Python

Anonymous » 29 окт 2024, 03:07 » в форуме Python

Я хочу построить объединенную модель CNN, используя 1D и 2D CNN, но я пробовал много способов ее создания, но этот сработал, но я не знаю, почему я получаю эту ошибку при использовании model_combined.summary().
Я приложил два изображения, которые...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
29 окт 2024, 03:07

Вернуться в «Python»