RuntimeError: Ожидалось, что все тензоры будут находиться на одном устройстве, но обнаружено как минимум два устройства:

RuntimeError: Ожидалось, что все тензоры будут находиться на одном устройстве, но обнаружено как минимум два устройства: ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

RuntimeError: Ожидалось, что все тензоры будут находиться на одном устройстве, но обнаружено как минимум два устройства:

Цитата

Сообщение Anonymous » 04 янв 2025, 10:54

Я сохранил контрольную точку во время тренировки на графическом процессоре. После перезагрузки контрольной точки и продолжения обучения получаю следующую ошибку:

Код: Выделить всё

Traceback (most recent call last):
File "main.py", line 140, in 
train(model,optimizer,train_loader,val_loader,criteria=args.criterion,epoch=epoch,batch=batch)
File "main.py", line 71, in train
optimizer.step()
File "/opt/conda/lib/python3.7/site-packages/torch/autograd/grad_mode.py", line 26, in decorate_context
return func(*args, **kwargs)
File "/opt/conda/lib/python3.7/site-packages/torch/optim/sgd.py", line 106, in step
buf.mul_(momentum).add_(d_p, alpha=1 - dampening)
RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!

Мой код обучения следующий:

Код: Выделить всё

def train(model,optimizer,train_loader,val_loader,criteria,epoch=0,batch=0):
batch_count = batch
if criteria == 'l1':
criterion = L1_imp_Loss()
elif criteria == 'l2':
criterion = L2_imp_Loss()
if args.gpu and torch.cuda.is_available():
model.cuda()
criterion = criterion.cuda()

print(f'{datetime.datetime.now().time().replace(microsecond=0)} Starting to train..')

while epoch 

Подробнее здесь: [url]https://stackoverflow.com/questions/66091226/runtimeerror-expected-all-tensors-to-be-on-the-same-device-but-found-at-least[/url]

1735977268

Anonymous

Я сохранил контрольную точку во время тренировки на графическом процессоре. После перезагрузки контрольной точки и продолжения обучения получаю следующую ошибку:
[code]Traceback (most recent call last):
File "main.py", line 140, in 
train(model,optimizer,train_loader,val_loader,criteria=args.criterion,epoch=epoch,batch=batch)
File "main.py", line 71, in train
optimizer.step()
File "/opt/conda/lib/python3.7/site-packages/torch/autograd/grad_mode.py", line 26, in decorate_context
return func(*args, **kwargs)
File "/opt/conda/lib/python3.7/site-packages/torch/optim/sgd.py", line 106, in step
buf.mul_(momentum).add_(d_p, alpha=1 - dampening)
RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!
[/code]
Мой код обучения следующий:
[code]def train(model,optimizer,train_loader,val_loader,criteria,epoch=0,batch=0):
batch_count = batch
if criteria == 'l1':
criterion = L1_imp_Loss()
elif criteria == 'l2':
criterion = L2_imp_Loss()
if args.gpu and torch.cuda.is_available():
model.cuda()
criterion = criterion.cuda()

print(f'{datetime.datetime.now().time().replace(microsecond=0)} Starting to train..')

while epoch 

Подробнее здесь: [url]https://stackoverflow.com/questions/66091226/runtimeerror-expected-all-tensors-to-be-on-the-same-device-but-found-at-least[/url]