TensorFlow: расчет градиентов потерь при регуляризации в зависимости от входных и выходных данных модели.

TensorFlow: расчет градиентов потерь при регуляризации в зависимости от входных и выходных данных модели. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

TensorFlow: расчет градиентов потерь при регуляризации в зависимости от входных и выходных данных модели.

Цитата

Сообщение Anonymous » 18 сен 2024, 20:01

Обзор
Моя модель — это кодировщик, у которого есть вход Z и выход x.
Я пытаюсь использовать total_loss, который содержит как традиционное контролируемое обучение, так и термины регуляризации. У меня есть дополнительные функции (вне сети), которые используют входные данные Z и прогнозируемые выходные данные x_pred для расчета соответствующих условий регуляризации для включения в расчет потерь.

Код: Выделить всё

# Custom training function within model class
def train_step(self, Z, x):
# Define loss object
loss_object = tf.keras.losses.MeanSquaredError()
with tf.GradientTape() as tape:
# Get encoder output
x_pred = self.encoder(Z)

# Calculate traditional supervised learning data loss
data_loss = loss_object(x, x_pred)

# Calculate regularization terms
x_hat, Z_pred = calc_reg_terms(x_pred, Z) # physics-informed function
# Calculate respective regularization losses
loss_x = loss_object(x, x_hat)
loss_z = loss_object(Z, Z_pred)

""""""

Вопрос
Каков правильный метод расчета градиента моей общей потери?
Раньше я пробовал просто складывать все члены потерь вместе, а затем брать градиент суммарных потерь.

Код: Выделить всё

### PAST METHOD ###
# Calculate total loss
total_loss = data_loss + a * loss_x + b * loss_z  # a,b -> set hyperparameters
# Get gradients
grads = tape.gradient(total_loss, self.trainable_weights)

Однако, поскольку мои loss_x и loss_z определены вне кодировщика, я боюсь, что эти потери действуют скорее как смещение в расчете total_loss потому что модель фактически работает хуже, когда эти потери добавляются к data_loss. Термин data_loss имеет четкую связь с обучаемыми весами кодера, что обеспечивает четкий расчет градиента, но то же самое нельзя легко сказать о моих терминах потерь при регуляризации.
ПРИМЕЧАНИЕ. Отслеживание каждой из этих трех потерь во время обучения показывает, что data_loss может уменьшаться с каждой проходящей эпохой обучения, но как loss_x, так и loss_z имеют тенденцию выходить на плато на ранних этапах во время обучения, отсюда и страх, что они действуют скорее как нежелательное смещение в отношении total_loss.
Как правильно затем вычислить градиенты с помощью data_loss
Как правильно затем вычислить градиенты с помощью data_loss? термины code>, loss_x и loss_z?

Подробнее здесь: https://stackoverflow.com/questions/789 ... nt-on-mode

1726678896

Anonymous

Обзор
Моя модель — это кодировщик, у которого есть вход Z и выход x.
Я пытаюсь использовать total_loss, который содержит как традиционное контролируемое обучение, так и термины регуляризации. У меня есть дополнительные функции (вне сети), которые используют входные данные Z и прогнозируемые выходные данные x_pred для расчета соответствующих условий регуляризации для включения в расчет потерь.
[code]# Custom training function within model class
def train_step(self, Z, x):
# Define loss object
loss_object = tf.keras.losses.MeanSquaredError()
with tf.GradientTape() as tape:
# Get encoder output
x_pred = self.encoder(Z)

# Calculate traditional supervised learning data loss
data_loss = loss_object(x, x_pred)

# Calculate regularization terms
x_hat, Z_pred = calc_reg_terms(x_pred, Z) # physics-informed function
# Calculate respective regularization losses
loss_x = loss_object(x, x_hat)
loss_z = loss_object(Z, Z_pred)

""""""
[/code]
Вопрос
[b]Каков правильный метод расчета градиента моей общей потери?[/b]
Раньше я пробовал просто складывать все члены потерь вместе, а затем брать градиент суммарных потерь.
[code]### PAST METHOD ###
# Calculate total loss
total_loss = data_loss + a * loss_x + b * loss_z  # a,b -> set hyperparameters
# Get gradients
grads = tape.gradient(total_loss, self.trainable_weights)
[/code]
Однако, поскольку мои loss_x и loss_z определены вне кодировщика, я боюсь, что эти потери действуют скорее как смещение в расчете total_loss потому что [b]модель фактически работает хуже, когда эти потери добавляются[/b] к data_loss. Термин data_loss имеет четкую связь с обучаемыми весами кодера, что обеспечивает четкий расчет градиента, но то же самое нельзя легко сказать о моих терминах потерь при регуляризации.
[b]ПРИМЕЧАНИЕ.[/b] Отслеживание каждой из этих трех потерь во время обучения показывает, что data_loss может уменьшаться с каждой проходящей эпохой обучения, но как loss_x, так и loss_z имеют тенденцию выходить на плато на ранних этапах во время обучения, отсюда и страх, что они действуют скорее как нежелательное смещение в отношении total_loss.
[b]Как правильно затем вычислить градиенты с помощью data_loss
Как правильно затем вычислить градиенты с помощью data_loss? термины code>, loss_x и loss_z?[/b] 

Подробнее здесь: [url]https://stackoverflow.com/questions/78999403/tensorflow-calculating-gradients-of-regularization-loss-terms-dependent-on-mode[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как добавить доверительный уровень к моей модели unet, а затем использовать его для регуляризации потерь в задаче перево

Последнее сообщение Anonymous « 03 окт 2024, 20:45
Добавлено в форуме Python

Anonymous » 03 окт 2024, 20:45 » в форуме Python

Чтобы добавить карту достоверности в мою сеть и затем использовать ее для регуляризации потерь, я добавил уровень достоверности в конце сети и применил его перед тем, как делать окончательные прогнозы.
Это модуль достоверности, который я использую:...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 20:45
Как передать 2 выходных данных из модели — логиты и карты внимания в пользовательскую функцию потерь

Последнее сообщение Anonymous « 02 мар 2024, 15:25
Добавлено в форуме Python

Anonymous » 02 мар 2024, 15:25 » в форуме Python

I am working on a model that has 2 outputs: 1st the predictions and 2nd the attention maps. I have stored my target attention maps on my disk as '.npy' files and have loaded and stored in the runtime as reshaped_y_train_fm. I want to pass the...

0 Ответы

60 Просмотры

Последнее сообщение Anonymous
02 мар 2024, 15:25
Как передать 2 выходных данных из модели — логиты и карты внимания в пользовательскую функцию потерь

Последнее сообщение Anonymous « 02 мар 2024, 16:23
Добавлено в форуме Python

Anonymous » 02 мар 2024, 16:23 » в форуме Python

I am working on a model that has 2 outputs: 1st the predictions and 2nd the attention maps. I have stored my target attention maps on my disk as '.npy' files and have loaded and stored in the runtime as reshaped_y_train_fm. I want to pass the...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
02 мар 2024, 16:23
VSCode Test Explorer зависает, несмотря на отсутствие ошибок в выходных данных и сбор всех тестов (в выходных данных)

Последнее сообщение Anonymous « 07 янв 2025, 13:12
Добавлено в форуме Python

Anonymous » 07 янв 2025, 13:12 » в форуме Python

У меня было много проблем с Test Explorer в VSCode. До прошлой недели все работало нормально. Я писал новые тесты и нажимал «Обновить тесты», а потом он внезапно (и довольно случайно) перестал работать — в частности, он «обнаруживает» тесты...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
07 янв 2025, 13:12
VSCode Test Explorer зависает, несмотря на отсутствие ошибок в выходных данных и сбор всех тестов (в выходных данных)

Последнее сообщение Anonymous « 07 янв 2025, 16:44
Добавлено в форуме Python

Anonymous » 07 янв 2025, 16:44 » в форуме Python

У меня было много проблем с Test Explorer в VSCode. До прошлой недели все работало нормально. Я писал новые тесты и нажимал «Обновить тесты», а потом он внезапно (и довольно случайно) перестал работать — в частности, он «обнаруживает» тесты...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
07 янв 2025, 16:44

Вернуться в «Python»