Как обрабатывать функцию потерь с разреженным выходом

Как обрабатывать функцию потерь с разреженным выходом ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как обрабатывать функцию потерь с разреженным выходом

Цитата

Сообщение Anonymous » 16 июл 2025, 09:40

Я пытаюсь создать модель ML в Tensorflow, которая принимает тензор с формой (128,128,12) и выводит тензор с формой (128,128,3), где выходные измерения означают (x, y, sensor_numb X-Y-координаты. Но если я возьму измерение, у меня всегда будет все 3 показания датчиков.

Код: Выделить всё

from keras import Input, layers, models

input_data = Input(shape=(128,128,12), name="input_data")
input_mask = Input(shape=(128,128,3), name="input_mask")

output_layer = layers.Conv2D(filters=3, kernel_size=(3,3), padding="same", activation="sigmoid", name="output")(input_data)
output_masked = layers.Multiply(name="masked_output")([output_layer, input_mask])

print(output_masked.shape)
# return input_data, input_mask, output_layer, output_masked

model = models.Model(inputs=input_data, outputs=output_layer)
model_masked = models.Model(inputs=[input_data, input_mask], outputs=output_masked)

model_masked.compile(optimizer="adam", loss="mse")
< /code>
Маска просто содержит те, что в координатах, где я проводил измерения, в противном случае нули. Если это полезно, не было бы проблемы использовать нули в Y_TRUE для получения маски, фактические показания датчика всегда превышают 0. Чтобы решить эту проблему, я решил, что мне нужна функция пользовательской потери, которая вычисляет только потерю для координат, где доступны данные. Я попробовал это: < /p>
from keras import ops
def masked_mse(y_true, y_pred):
mask_value = 0
mask = ops.repeat(
ops.cast(
ops.any(
ops.not_equal(y_true, mask_value),
axis=-1, keepdims=True,
),
"float32"
),
repeats=y_true.shape[-1], axis=-1
)
masked_squared_error = ops.square(mask * (y_pred - y_true))
masked_mse = ops.sum(masked_squared_error, axis=-1) / ops.sum(mask, axis=-1) # results in lots of NaNs
# masked_mse = ops.sum(masked_squared_error, axis=-1) / ops.maximum(ops.sum(mask, axis=-1), 1) # results in lots of zeros
return masked_mse
< /code>
Но я не понимаю, как эта функция потерь применяется во время обучения.
Если вы заметили, я включил два варианта о том, как вычислять masked_mse < /code>.
Первый из них результатов в NANS, где не представлены измерения. Выход на x-y-координату.
во время тренировок, однако, tensorflow регистрирует потерю как одно значение, которое всегда будет NAN.
Я не понимаю, как рассчитывается эта агрегация. Потери и модель обучения для прогнозирования в основном нулей. С сокращением = нет

Это рассчитывает координат MSE. С REDUT = "SUM_OVER_BATCH_SIZE" (по умолчанию) Это рассчитывает одно значение. Это как я должен определить свою функцию потери в маске?

Подробнее здесь: https://stackoverflow.com/questions/796 ... rse-output

1752648028

Anonymous

 Я пытаюсь создать модель ML в Tensorflow, которая принимает тензор с формой (128,128,12) и выводит тензор с формой (128,128,3), где выходные измерения означают (x, y, sensor_numb X-Y-координаты. Но если я возьму измерение, у меня всегда будет все 3 показания датчиков.[code]from keras import Input, layers, models

input_data = Input(shape=(128,128,12), name="input_data")
input_mask = Input(shape=(128,128,3), name="input_mask")

output_layer = layers.Conv2D(filters=3, kernel_size=(3,3), padding="same", activation="sigmoid", name="output")(input_data)
output_masked = layers.Multiply(name="masked_output")([output_layer, input_mask])

print(output_masked.shape)
# return input_data, input_mask, output_layer, output_masked

model = models.Model(inputs=input_data, outputs=output_layer)
model_masked = models.Model(inputs=[input_data, input_mask], outputs=output_masked)

model_masked.compile(optimizer="adam", loss="mse")
< /code>
Маска просто содержит те, что в координатах, где я проводил измерения, в противном случае нули. Если это полезно, не было бы проблемы использовать нули в Y_TRUE для получения маски, фактические показания датчика всегда превышают 0. Чтобы решить эту проблему, я решил, что мне нужна функция пользовательской потери, которая вычисляет только потерю для координат, где доступны данные. Я попробовал это: < /p>
from keras import ops
def masked_mse(y_true, y_pred):
mask_value = 0
mask = ops.repeat(
ops.cast(
ops.any(
ops.not_equal(y_true, mask_value),
axis=-1, keepdims=True,
),
"float32"
),
repeats=y_true.shape[-1], axis=-1
)
masked_squared_error = ops.square(mask * (y_pred - y_true))
masked_mse = ops.sum(masked_squared_error, axis=-1) / ops.sum(mask, axis=-1) # results in lots of NaNs
# masked_mse = ops.sum(masked_squared_error, axis=-1) / ops.maximum(ops.sum(mask, axis=-1), 1) # results in lots of zeros
return masked_mse
< /code>
Но я не понимаю, как эта функция потерь применяется во время обучения.
Если вы заметили, я включил два варианта о том, как вычислять masked_mse < /code>.
Первый из них результатов в NANS, где не представлены измерения. Выход на x-y-координату.
во время тренировок, однако, tensorflow регистрирует потерю как одно значение, которое всегда будет NAN.
Я не понимаю, как рассчитывается эта агрегация. Потери и модель обучения для прогнозирования в основном нулей. С сокращением = нет [/code] Это рассчитывает координат MSE. С REDUT = "SUM_OVER_BATCH_SIZE"  (по умолчанию) Это рассчитывает одно значение. Это как я должен определить свою функцию потери в маске? 
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79680467/how-to-handle-loss-function-with-sparse-output[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как обрабатывать функцию потерь с разреженным выходом

Последнее сообщение Anonymous « 26 июн 2025, 15:11
Добавлено в форуме Python

Anonymous » 26 июн 2025, 15:11 » в форуме Python

Я пытаюсь создать модель ML в Tensorflow, которая принимает тензор с формой (128,128,12) и выводит тензор с формой (128,128,3), где средние измерения выходных данных означают (x, y, sensor_values). X-Y-координаты. Но если я возьму измерение, у меня...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
26 июн 2025, 15:11
Как обрабатывать функцию потерь с разреженным выходом

Последнее сообщение Anonymous « 26 июн 2025, 19:50
Добавлено в форуме Python

Anonymous » 26 июн 2025, 19:50 » в форуме Python

Я пытаюсь создать модель ML в Tensorflow, которая принимает тензор с формой (128,128,12) и выводит тензор с формой (128,128,3), где выходные измерения означают (x, y, sensor_numb X-Y-координаты. Но если я возьму измерение, у меня всегда будет все 3...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
26 июн 2025, 19:50
Расчет потерь в модели VAE со сценарием с несколькими входами и одним выходом

Последнее сообщение Гость « 27 фев 2024, 20:41
Добавлено в форуме Python

Гость » 27 фев 2024, 20:41 » в форуме Python

Я работал над обучением своей модели VAE, используя два входных изображения: изображение диэлектрической проницаемости внутренней среды и изображение местоположения точки доступа в помещении. Я успешно сформулировал измерения кодера, декодера и...

0 Ответы

50 Просмотры

Последнее сообщение Гость
27 фев 2024, 20:41
Объединение пользовательской функции потерь с предопределенной функцией потерь (Dice и Focal) для обучения DeeplabV3Plus

Последнее сообщение Anonymous « 19 окт 2023, 10:37
Добавлено в форуме Python

Anonymous » 19 окт 2023, 10:37 » в форуме Python

Я обучаю DeeplabV3+ семантической сегментации изображений дистанционного зондирования. Я создаю модель после урока по keras ( ), и она отлично работает, когда я использую для обучения фокусную потерю (предустановленную в Keras/tf). Маски имеют...

0 Ответы

51 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 10:37
Независимо от платформы, определите, является ли файл разреженным [дубликат]

Последнее сообщение Anonymous « 05 ноя 2024, 02:13
Добавлено в форуме JAVA

Anonymous » 05 ноя 2024, 02:13 » в форуме JAVA

Я пытаюсь определить, является ли данный файл разреженным. Я знаю, что есть способ проверить, используя собственный API Windows, и что в системах на базе Unix есть команда stat для получения чисел для логического размера и фактических выделенных...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 02:13

Вернуться в «Python»