Попробовал изменить вывод модели vae, чтобы удовлетворить функцию потерь, но что-то не работает

Попробовал изменить вывод модели vae, чтобы удовлетворить функцию потерь, но что-то не работает ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Попробовал изменить вывод модели vae, чтобы удовлетворить функцию потерь, но что-то не работает

Цитата

Сообщение Anonymous » 17 сен 2024, 01:46

Я пытался создать модель VAE, которая обычно содержит пользовательские потери, для реализации которых используется GradientTape() или класс. Я не хотел использовать эти методы и вместо этого попробовал обходной путь, который не работает должным образом, и мне хотелось знать, почему.
код модели, который я пробовал - (кодер и декодер только базовые модели, где кодер выводит z_mean, z_log_var, z, а декодер выводит пакет изображений) -

Код: Выделить всё

def build_vae(encoder, decoder, input_shape):
input_layer = layers.Input(shape=input_shape)
z_mean, z_log_var, z = encoder(input_layer)
generated_images = decoder(z)

return models.Model(input_layer, [generated_images, z_mean, z_log_var])

таможенная потеря -

Код: Выделить всё

def custom_vae_loss(y_true, y_pred):
generated_images = y_pred[0]
z_mean = y_pred[1]
z_log_var = y_pred[2]

r_loss = tf.reduce_mean(tf.keras.losses.binary_crossentropy(y_true, generated_images))
kl_loss = -0.5 * (tf.reduce_mean(1 + z_log_var - tf.square(z_mean) - tf.exp(z_log_var)))

return r_loss+kl_loss

код обучения –

Код: Выделить всё

vae.train_on_batch(batch, batch)

ошибка в том, что target_shape = (8, 256, 256, 3) не соответствует output_shape = (256, 256, 3)
Я думал о том, что список, который должен был быть y_pred, сжимается или что-то в этом роде, так что z_mean и z_log_var удаляются, что означает, что y_pred (из custom_vae_loss) — это пакет сгенерированных изображений, и поэтомуgenerated_images — это просто Первое сгенерированное изображение пакета.
после добавления операторов печати в функцию потерь
y_pred равно Tensor("vae_1/decoder_1/conv2d_transpose_31_1/Sigmoid:0", shape=(8, 256, 256, 3 ), dtype=float32)
форма y_true: (8, 256, 256, 3)
форма сгенерированных_изображений: (256, 256, 3)
форма z_mean: (256, 256, 3)
форма z_log_var: (256, 256, 3)
как мне стоит это исправить? желательно без GradientTape() или класса. (Я хотел сделать это без этих методов)

Подробнее здесь: https://stackoverflow.com/questions/789 ... mething-do

1726526797

Anonymous

Я пытался создать модель VAE, которая обычно содержит пользовательские потери, для реализации которых используется GradientTape() или класс. Я не хотел использовать эти методы и вместо этого попробовал обходной путь, который не работает должным образом, и мне хотелось знать, почему.
код модели, который я пробовал - (кодер и декодер только базовые модели, где кодер выводит z_mean, z_log_var, z, а декодер выводит пакет изображений) -
[code]def build_vae(encoder, decoder, input_shape):
input_layer = layers.Input(shape=input_shape)
z_mean, z_log_var, z = encoder(input_layer)
generated_images = decoder(z)

return models.Model(input_layer, [generated_images, z_mean, z_log_var])
[/code]
таможенная потеря -
[code]def custom_vae_loss(y_true, y_pred):
generated_images = y_pred[0]
z_mean = y_pred[1]
z_log_var = y_pred[2]

r_loss = tf.reduce_mean(tf.keras.losses.binary_crossentropy(y_true, generated_images))
kl_loss = -0.5 * (tf.reduce_mean(1 + z_log_var - tf.square(z_mean) - tf.exp(z_log_var)))

return r_loss+kl_loss
[/code]
код обучения –
[code]vae.train_on_batch(batch, batch)[/code]
ошибка в том, что target_shape = (8, 256, 256, 3) не соответствует output_shape = (256, 256, 3)
Я думал о том, что список, который должен был быть y_pred, сжимается или что-то в этом роде, так что z_mean и z_log_var удаляются, что означает, что y_pred (из custom_vae_loss) — это пакет сгенерированных изображений, и поэтомуgenerated_images — это просто Первое сгенерированное изображение пакета.
после добавления операторов печати в функцию потерь
y_pred равно Tensor("vae_1/decoder_1/conv2d_transpose_31_1/Sigmoid:0", shape=(8, 256, 256, 3 ), dtype=float32)
форма y_true: (8, 256, 256, 3)
форма сгенерированных_изображений: (256, 256, 3)
форма z_mean: (256, 256, 3)
форма z_log_var: (256, 256, 3)
как мне стоит это исправить? желательно без GradientTape() или класса. (Я хотел сделать это без этих методов) 

Подробнее здесь: [url]https://stackoverflow.com/questions/78991901/tried-changing-the-output-of-vae-model-to-satisfy-loss-function-but-something-do[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Расчет потерь в модели VAE со сценарием с несколькими входами и одним выходом

Последнее сообщение Гость « 27 фев 2024, 20:41
Добавлено в форуме Python

Гость » 27 фев 2024, 20:41 » в форуме Python

Я работал над обучением своей модели VAE, используя два входных изображения: изображение диэлектрической проницаемости внутренней среды и изображение местоположения точки доступа в помещении. Я успешно сформулировал измерения кодера, декодера и...

0 Ответы

49 Просмотры

Последнее сообщение Гость
27 фев 2024, 20:41
Могу ли я включить параметры другой модели в функцию потерь этой модели?

Последнее сообщение Anonymous « 20 мар 2024, 07:17
Добавлено в форуме Python

Anonymous » 20 мар 2024, 07:17 » в форуме Python

У меня есть модель (A), которую необходимо обучить на основе ее сходства с другой моделью (B).
Решение 1: я передаю B функции потерь A в этой функции , я вычисляю B.parameters().
Решение 2: я передаю B.parameters() функции потерь A.
Я провожу...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
20 мар 2024, 07:17
Объединение пользовательской функции потерь с предопределенной функцией потерь (Dice и Focal) для обучения DeeplabV3Plus

Последнее сообщение Anonymous « 19 окт 2023, 10:37
Добавлено в форуме Python

Anonymous » 19 окт 2023, 10:37 » в форуме Python

Я обучаю DeeplabV3+ семантической сегментации изображений дистанционного зондирования. Я создаю модель после урока по keras ( ), и она отлично работает, когда я использую для обучения фокусную потерю (предустановленную в Keras/tf). Маски имеют...

0 Ответы

50 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 10:37
Сокращение и реконструкция параметров модели CNN с использованием VAE

Последнее сообщение Anonymous « 10 май 2024, 01:59
Добавлено в форуме Python

Anonymous » 10 май 2024, 01:59 » в форуме Python

Предположим, у меня есть простая модель CNN с двумя слоями Conv2D, я обучил эту модель на своем наборе данных изображений, я собираюсь передать параметры этой модели CNN в VAE (в качестве входных данных кодировщика), чтобы сначала уменьшить их...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
10 май 2024, 01:59
Сокращение и реконструкция параметров модели CNN с использованием VAE

Последнее сообщение Anonymous « 17 сен 2024, 01:48
Добавлено в форуме Python

Anonymous » 17 сен 2024, 01:48 » в форуме Python

Предположим, у меня есть простая модель CNN с двумя слоями Conv2D, я обучил эту модель на своем наборе данных изображений, я собираюсь передать параметры этой модели CNN в VAE (в качестве входных данных кодировщика), чтобы сначала уменьшить их...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
17 сен 2024, 01:48

Вернуться в «Python»