Обучение разных этапов модели с разными потерями

Обучение разных этапов модели с разными потерями ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Обучение разных этапов модели с разными потерями

Цитата

Сообщение Anonymous » 20 ноя 2024, 09:10

Я пытаюсь обучить двухэтапную модель сквозным способом. Однако я хочу обновить разные этапы моделей с разными потерями. Например, предположим, что сквозная модель состоит из двух моделей: модель1 и модель2. Результат рассчитывается при запуске

Код: Выделить всё

features = model1(inputs)
output = model2(features)

Я хочу обновить параметры модели1 с помощью loss1, сохранив при этом параметр модели2 без изменений. Далее я хочу обновить параметры модели2 с помощью loss2, сохранив при этом параметр модели1 без изменений. Моя полная реализация выглядит примерно так:

Код: Выделить всё

import torch
import torch.nn as nn

# Define the first model
class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.conv1 = nn.Linear(20, 10)
self.conv2 = nn.Linear(10, 5)

def forward(self, x):
x = self.conv1(x)
x = self.conv2(x)
return x

# Define the second model
class Net1(nn.Module):
def __init__(self):
super(Net1, self).__init__()
self.conv1 = nn.Linear(5, 1)

def forward(self, x):
x = self.conv1(x)
return x

# Initialize models
model1 = Net()
model2 = Net1()

# Initialize separate optimizers for each model
optimizer = torch.optim.SGD(model1.parameters(), lr=0.1)
optimizer1 = torch.optim.SGD(model2.parameters(), lr=0.1)

optimizer.zero_grad()
optimizer1.zero_grad()

criterion = nn.CrossEntropyLoss()

# Sample inputs and labels
inputs = torch.randn(2, 20)
labels = torch.randn(2,1)

features = model1(inputs)
outputs_model = model2(features)

loss1 = criterion(outputs_model[0], labels[0])
loss2 = criterion(outputs_model, labels)

loss1.backward(retain_graph=True)
optimizer.step()
optimizer.zero_grad()
optimizer1.zero_grad()

loss2.backward()
optimizer1.step()
optimizer.zero_grad()
optimizer1.zero_grad()

print(f"Loss1 (Net): {loss1.item()}")
print(f"Loss2 (Net1): {loss2.item()}")

Однако это вернется

Код: Выделить всё

RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.FloatTensor [10, 5]], which is output 0 of AsStridedBackward0, is at version 2; expected version 1 instead. Hint: enable anomaly detection to find the operation that failed to compute its gradient, with torch.autograd.set_detect_anomaly(True).

Полное сообщение об ошибке:

Код: Выделить всё

Traceback (most recent call last):
File ", line 55, in 
loss2.backward()
^^^^^^^^^^^^^^^^
File "/opt/homebrew/anaconda3/lib/python3.11/site-packages/torch/_tensor.py", line 521, in backward
torch.autograd.backward(
File "/opt/homebrew/anaconda3/lib/python3.11/site-packages/torch/autograd/__init__.py", line 289, in backward
_engine_run_backward(
File "/opt/homebrew/anaconda3/lib/python3.11/site-packages/torch/autograd/graph.py", line 769, in _engine_run_backward
return Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.FloatTensor [10, 5]], which is output 0 of AsStridedBackward0, is at version 2; expected version 1 instead. Hint: enable anomaly detection to find the operation that failed to compute its gradient, with torch.autograd.set_detect_anomaly(True).

Я вроде понимаю, почему это происходит, но есть ли способ решить эту проблему? Любая помощь приветствуется.

Подробнее здесь: https://stackoverflow.com/questions/792 ... erent-loss

1732083033

Anonymous

Я пытаюсь обучить двухэтапную модель сквозным способом. Однако я хочу обновить разные этапы моделей с разными потерями. Например, предположим, что сквозная модель состоит из двух моделей: модель1 и модель2. Результат рассчитывается при запуске
[code]features = model1(inputs)
output = model2(features)
[/code]
Я хочу обновить параметры модели1 с помощью loss1, сохранив при этом параметр модели2 без изменений. Далее я хочу обновить параметры модели2 с помощью loss2, сохранив при этом параметр модели1 без изменений. Моя полная реализация выглядит примерно так:
[code]import torch
import torch.nn as nn

# Define the first model
class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.conv1 = nn.Linear(20, 10)
self.conv2 = nn.Linear(10, 5)

def forward(self, x):
x = self.conv1(x)
x = self.conv2(x)
return x

# Define the second model
class Net1(nn.Module):
def __init__(self):
super(Net1, self).__init__()
self.conv1 = nn.Linear(5, 1)

def forward(self, x):
x = self.conv1(x)
return x

# Initialize models
model1 = Net()
model2 = Net1()

# Initialize separate optimizers for each model
optimizer = torch.optim.SGD(model1.parameters(), lr=0.1)
optimizer1 = torch.optim.SGD(model2.parameters(), lr=0.1)

optimizer.zero_grad()
optimizer1.zero_grad()

criterion = nn.CrossEntropyLoss()

# Sample inputs and labels
inputs = torch.randn(2, 20)
labels = torch.randn(2,1)

features = model1(inputs)
outputs_model = model2(features)

loss1 = criterion(outputs_model[0], labels[0])
loss2 = criterion(outputs_model, labels)

loss1.backward(retain_graph=True)
optimizer.step()
optimizer.zero_grad()
optimizer1.zero_grad()

loss2.backward()
optimizer1.step()
optimizer.zero_grad()
optimizer1.zero_grad()

print(f"Loss1 (Net): {loss1.item()}")
print(f"Loss2 (Net1): {loss2.item()}")
[/code]
Однако это вернется
[code]RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.FloatTensor [10, 5]], which is output 0 of AsStridedBackward0, is at version 2; expected version 1 instead. Hint: enable anomaly detection to find the operation that failed to compute its gradient, with torch.autograd.set_detect_anomaly(True).
[/code]
Полное сообщение об ошибке:
[code]Traceback (most recent call last):
File ", line 55, in 
loss2.backward()
^^^^^^^^^^^^^^^^
File "/opt/homebrew/anaconda3/lib/python3.11/site-packages/torch/_tensor.py", line 521, in backward
torch.autograd.backward(
File "/opt/homebrew/anaconda3/lib/python3.11/site-packages/torch/autograd/__init__.py", line 289, in backward
_engine_run_backward(
File "/opt/homebrew/anaconda3/lib/python3.11/site-packages/torch/autograd/graph.py", line 769, in _engine_run_backward
return Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.FloatTensor [10, 5]], which is output 0 of AsStridedBackward0, is at version 2; expected version 1 instead. Hint: enable anomaly detection to find the operation that failed to compute its gradient, with torch.autograd.set_detect_anomaly(True).
[/code]
Я вроде понимаю, почему это происходит, но есть ли способ решить эту проблему? Любая помощь приветствуется. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79205991/training-different-stage-of-model-with-different-loss[/url]