Torch.autograd.functional.jacobian возвращает тензоры со всеми нулями

Torch.autograd.functional.jacobian возвращает тензоры со всеми нулями ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Torch.autograd.functional.jacobian возвращает тензоры со всеми нулями

Цитата

Сообщение Anonymous » 09 июн 2025, 15:44

Я пытаюсь использовать Torch.autograd.functional.jacobian для расчета градиентов параметров модели в отношении набора потерь, но он возвращает все нули. Моя функция определение следующего < /p>
def load_weights(model, names, orig_params, new_params, as_params=False):
param_shapes = [p.shape for p in model.dnn.parameters()]

start = 0
for name, p, new_p, shape in zip(names, orig_params, new_params, param_shapes):
numel = int(torch.prod(torch.tensor(shape)))
set_attr(model.dnn, name.split("."), torch.nn.Parameter(new_params[start:start + numel].view(shape)))
start += numel

def func(param_list):
load_weights(self.model, names, org_param, param_list, 1)
result = self.eq_cons(param_list)
result.requires_grad_()
return result

jac_mtx = torch.autograd.functional.jacobian(func, param_list, strict=1)
< /code>
Функция eq_cons обновляет модель, используя пропущенные параметры, предсказывают результат некоторых учебных данных, вычисляет серию потерь и объединяет их в массив с формой, соответствующей конкретным данным. Когда я изменяю param_list, видно, что возвращаемое значение EQ_CONS и функцию func оба изменения. Когда я устанавливаю строгое = 1, это повышает ошибку: < /p>
RuntimeError: Output 0 of the user-provided function is independent of input 0. This is not allowed in strict mode.
< /code>
Чтобы решить эту проблему, я проверяю model.parameters () в конце функции load_weights, и я уверен, что параметры обновляются. Кроме того, я попытался разделить выход, вызовать обратно в цикл и использовал следующий код для расчета градиентов отдельно. Однако он вернул один и тот же результат для разных терминов в выходе. < /P>
for index in range(len(output)):
self.model.dnn.zero_grad()
item = output[index]
item.backward()
for p in self.model.dnn.parameters():
param_grad = p.grad.detach().data
< /code>
Я смущен этой ошибкой, потому что выходной сигнал Func изменяется при вводе, и я понятия не имею, как ее решить. Почему происходит эта ошибка? Как я могу изменить свой код для правильного вычисления якобиана?

Подробнее здесь: https://stackoverflow.com/questions/796 ... -all-zeros

1749473058

Anonymous

 Я пытаюсь использовать Torch.autograd.functional.jacobian для расчета градиентов параметров модели в отношении набора потерь, но он возвращает все нули. Моя функция определение следующего < /p>
def load_weights(model, names, orig_params, new_params, as_params=False):
param_shapes = [p.shape for p in model.dnn.parameters()]

start = 0
for name, p, new_p, shape in zip(names, orig_params, new_params, param_shapes):
numel = int(torch.prod(torch.tensor(shape)))
set_attr(model.dnn, name.split("."), torch.nn.Parameter(new_params[start:start + numel].view(shape)))
start += numel

def func(param_list):
load_weights(self.model, names, org_param, param_list, 1)
result = self.eq_cons(param_list)
result.requires_grad_()
return result

jac_mtx = torch.autograd.functional.jacobian(func, param_list, strict=1)
< /code>
Функция eq_cons обновляет модель, используя пропущенные параметры, предсказывают результат некоторых учебных данных, вычисляет серию потерь и объединяет их в массив с формой, соответствующей конкретным данным. Когда я изменяю param_list, видно, что возвращаемое значение EQ_CONS и функцию func оба изменения. Когда я устанавливаю строгое = 1, это повышает ошибку: < /p>
RuntimeError: Output 0 of the user-provided function is independent of input 0. This is not allowed in strict mode.
< /code>
Чтобы решить эту проблему, я проверяю model.parameters () в конце функции load_weights, и я уверен, что параметры обновляются. Кроме того, я попытался разделить выход, вызовать обратно в цикл и использовал следующий код для расчета градиентов отдельно. Однако он вернул один и тот же результат для разных терминов в выходе. < /P>
for index in range(len(output)):
self.model.dnn.zero_grad()
item = output[index]
item.backward()
for p in self.model.dnn.parameters():
param_grad = p.grad.detach().data
< /code>
Я смущен этой ошибкой, потому что выходной сигнал Func изменяется при вводе, и я понятия не имею, как ее решить. Почему происходит эта ошибка? Как я могу изменить свой код для правильного вычисления якобиана?  

Подробнее здесь: [url]https://stackoverflow.com/questions/79658856/torch-autograd-functional-jacobian-returns-tensors-with-all-zeros[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Torch.autograd.functional.jacobian возвращает тензоры со всеми нулями

Последнее сообщение Anonymous « 10 июн 2025, 10:01
Добавлено в форуме Python

Anonymous » 10 июн 2025, 10:01 » в форуме Python

Я пытаюсь использовать Torch.autograd.functional.jacobian для расчета градиентов параметров модели в отношении набора потерь, но возвращает все нули. Моя функция определение следующего
def load_weights(model, names, orig_params, new_params,...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
10 июн 2025, 10:01
Есть ли более быстрая и экономичная по памяти альтернатива torch.autograd.functional.jacobian(model.decoder, latent_l)?

Последнее сообщение Anonymous « 17 дек 2024, 18:16
Добавлено в форуме Python

Anonymous » 17 дек 2024, 18:16 » в форуме Python

У меня есть декодер model.decoder, который состоит из серии слоев Convolutional Batchnorm и ReLU. У меня есть скрытый вектор latent_l, который представляет собой 8-мерный скрытый вектор, скажем, имеет размерность (1, 8, 1, 1), где 1 — размер пакета....

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
17 дек 2024, 18:16
Почему вывод torch.nn.functional.linear отличается при умножении каждой строки?

Последнее сообщение Anonymous « 21 май 2024, 06:49
Добавлено в форуме Python

Anonymous » 21 май 2024, 06:49 » в форуме Python

Когда я использую torch.nn.functional.linear, я иногда обнаруживаю, что выходные данные отличаются от результатов умножения каждой строки A и W. Например, если A.shape равен , W.shape — , res0 = F.linear(A, Weight=B,bias=None), res0 =59598184. , но...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
21 май 2024, 06:49
Torch.nn.functional.softmax дает неточные выходные данные softmax

Последнее сообщение Anonymous « 23 дек 2024, 08:18
Добавлено в форуме Python

Anonymous » 23 дек 2024, 08:18 » в форуме Python

Я пытаюсь реализовать скрытое самообслуживание с нуля, но при расчете softmax для оценок сходства я получаю странные результаты. Я просмотрел документацию и другие вопросы, размещенные здесь, но до сих пор не могу понять, что делаю неправильно. Ниже...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
23 дек 2024, 08:18
Что такое ComputeType of torch.nn.functional.lineear, когда вход Float16 или Bfloat16

Последнее сообщение Anonymous « 31 мар 2025, 07:05
Добавлено в форуме Python

Anonymous » 31 мар 2025, 07:05 » в форуме Python

В следующем коде
import torch
from torch.nn.functional import linear
a=torch.ones(2,3).type(torch.float16)
b=torch.ones(2,3).type(torch.float16)
linear(a,b)

Что такое Computepe линейного, FP32 или FP16 или другого?>

Подробнее здесь:

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
31 мар 2025, 07:05

Вернуться в «Python»