Модуль pytorch B=A, A.to('cpu'), но тензор в B все еще находится в графическом процессоре, почему? - Цифровое Кемерово

Модуль pytorch B=A, A.to('cpu'), но тензор в B все еще находится в графическом процессоре, почему? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Модуль pytorch B=A, A.to('cpu'), но тензор в B все еще находится в графическом процессоре, почему?

Цитата

Сообщение Anonymous » 28 ноя 2025, 12:05

После преобразования модуля A в ЦП тензор исходного параметра все еще остается на графическом процессоре? Когда он выйдет? Будет ли неправильно, если я повторно использую параметр?
Мой код:

Код: Выделить всё

import torch.nn as nn

class A(nn.Module):
def __init__(self):
super().__init__()
self.fc = nn.Linear(10, 5)
self.relu = nn.ReLU()

def forward(self, x):
return self.relu(self.fc(x))

a = A().to('cuda')

weight = {}
for key, value in a.state_dict().items():
weight[key] = value

a.to('cpu')
print("a.state_dict() device:", [t.device for t in a.state_dict().values()])  # in CPU
print("weight device:", [t.device for t in weight.values()])  # still in GPU

Результат:

Код: Выделить всё

a.state_dict() device: [device(type='cpu'), device(type='cpu'), device(type='cpu'), device(type='cpu')]

weight device: [device(type='cuda', index=0), device(type='cuda', index=0), device(type='cuda', index=0), device(type='cuda', index=0)]

Почему тензоры веса все еще находятся на графическом процессоре?

Подробнее здесь: https://stackoverflow.com/questions/798 ... in-gpu-why

1764320740

Anonymous

После преобразования модуля A в ЦП тензор исходного параметра все еще остается на графическом процессоре? Когда он выйдет? Будет ли неправильно, если я повторно использую параметр?
Мой код:
[code]import torch.nn as nn

class A(nn.Module):
def __init__(self):
super().__init__()
self.fc = nn.Linear(10, 5)
self.relu = nn.ReLU()

def forward(self, x):
return self.relu(self.fc(x))

a = A().to('cuda')

weight = {}
for key, value in a.state_dict().items():
weight[key] = value

a.to('cpu')
print("a.state_dict() device:", [t.device for t in a.state_dict().values()])  # in CPU
print("weight device:", [t.device for t in weight.values()])  # still in GPU
[/code]
Результат:
[code]a.state_dict() device: [device(type='cpu'), device(type='cpu'), device(type='cpu'), device(type='cpu')]

weight device: [device(type='cuda', index=0), device(type='cuda', index=0), device(type='cuda', index=0), device(type='cuda', index=0)]
[/code]
Почему тензоры веса все еще находятся на графическом процессоре? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79826375/pytorch-module-b-a-a-tocpu-but-the-tensor-in-b-is-still-in-gpu-why[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»