Понимание градиентов Pytorch и обратной функции, когда он обратно не раз в обратном направлении

Понимание градиентов Pytorch и обратной функции, когда он обратно не раз в обратном направлении ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Понимание градиентов Pytorch и обратной функции, когда он обратно не раз в обратном направлении

Цитата

Сообщение Anonymous » 28 май 2025, 23:52

Я пытаюсь добавить более одного шага обучения генератора за цикл в GAN, то есть я хочу, чтобы мой генератор обновлял его параметры n раз каждый m обновления дискриминатора, где n> m .

Код: Выделить всё

for epoch in range(num_epochs):
for batch_idx, (real, _) in enumerate(loader):
real = real.view(-1, 784).to(device)
batch_size = real.shape[0]

# Training Generator
for i in range(gen_advantage):
noise = torch.randn(batch_size, z_dim).to(device)
fake = gen(noise)
output = disc(fake).view(-1)
lossG = criterion(output, torch.ones_like(output))
lossG.backward()
opt_gen.step()
gen.zero_grad()

# Training Discriminator
for i in range(disc_advantage):
disc_real = disc(real).view(-1)
lossD_real = criterion(disc_real, torch.ones_like(disc_real))
disc_fake = disc(fake).view(-1)
lossD_fake = criterion(disc_fake, torch.zeros_like(disc_fake))
lossD = (lossD_real + lossD_fake) * 0.5
lossD.backward() # Breaks here
opt_disc.step()
disc.zero_grad()

Для контекста, критерий - это bceloss , opt_gen и opt_disc оптимальные. Adam , Disc и Gen являются дискриминатором и генераторами и изображениями в кодовом коде> 28x28. Lossd.backward () Line, даже если disc_advantage == 1 :

Код: Выделить всё

RuntimeError: Trying to backward through the graph a second time (or directly access saved tensors after they have already been freed). Saved intermediate values of the graph are freed when you call .backward() or autograd.grad(). Specify retain_graph=True if you need to backward through the graph a second time or if you need to access saved tensors after calling backward.

I can't get why, since in my understanding, I'm neither accessing freed tensors nor backwarding the lossD multiple times.
Anyhow, i tried as suggested to put retain_graph=True in the lossG.backward() line (in the generator loop), but it throws another different error:

Код: Выделить всё

RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.FloatTensor [512, 784]], which is output 0 of AsStridedBackward0, is at version 15; expected version 14 instead. Hint: enable anomaly detection to find the operation that failed to compute its gradient, with torch.autograd.set_detect_anomaly(True).

, который я действительно не могу понять, так как ошибка выбрасывается в той же строке, что и раньше, то есть hourdd.backward () .
это все. Я попытался выяснить это в одиночку, соскребая сеть для объяснений того, как работают градиенты питорха, но я нашел только некоторые теоретические статьи о том, как вычисляются градиенты, что, хотя и интересно, а не то, что мне нужно.
Так что помогите.

Подробнее здесь: https://stackoverflow.com/questions/796 ... g-more-tha

1748465551

Anonymous

 Я пытаюсь добавить более одного шага обучения генератора за цикл в GAN, то есть я хочу, чтобы мой генератор обновлял его параметры  n  раз каждый  m  обновления дискриминатора, где  n> m .[code]for epoch in range(num_epochs):
for batch_idx, (real, _) in enumerate(loader):
real = real.view(-1, 784).to(device)
batch_size = real.shape[0]

# Training Generator
for i in range(gen_advantage):
noise = torch.randn(batch_size, z_dim).to(device)
fake = gen(noise)
output = disc(fake).view(-1)
lossG = criterion(output, torch.ones_like(output))
lossG.backward()
opt_gen.step()
gen.zero_grad()

# Training Discriminator
for i in range(disc_advantage):
disc_real = disc(real).view(-1)
lossD_real = criterion(disc_real, torch.ones_like(disc_real))
disc_fake = disc(fake).view(-1)
lossD_fake = criterion(disc_fake, torch.zeros_like(disc_fake))
lossD = (lossD_real + lossD_fake) * 0.5
lossD.backward() # Breaks here
opt_disc.step()
disc.zero_grad()

[/code]
Для контекста, критерий  - это bceloss , opt_gen  и opt_disc  оптимальные. Adam , Disc  и Gen  являются дискриминатором и генераторами и изображениями в кодовом коде> 28x28. Lossd.backward ()  Line, даже если disc_advantage == 1 : 
[code]RuntimeError: Trying to backward through the graph a second time (or directly access saved tensors after they have already been freed). Saved intermediate values of the graph are freed when you call .backward() or autograd.grad(). Specify retain_graph=True if you need to backward through the graph a second time or if you need to access saved tensors after calling backward.
[/code]
I can't get why, since in my understanding, I'm neither accessing freed tensors nor backwarding the lossD multiple times.
Anyhow, i tried as suggested to put retain_graph=True in the lossG.backward() line (in the generator loop), but it throws another different error:
[code]RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.FloatTensor [512, 784]], which is output 0 of AsStridedBackward0, is at version 15; expected version 14 instead. Hint: enable anomaly detection to find the operation that failed to compute its gradient, with torch.autograd.set_detect_anomaly(True).
[/code]
, который я действительно не могу понять, так как ошибка выбрасывается в той же строке, что и раньше, то есть hourdd.backward () . 
это все. Я попытался выяснить это в одиночку, соскребая сеть для объяснений того, как работают градиенты питорха, но я нашел только некоторые теоретические статьи о том, как вычисляются градиенты, что, хотя и интересно, а не то, что мне нужно. 
Так что помогите.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79641308/understanding-pytorch-gradients-and-backward-function-when-backwarding-more-tha[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Понимание градиентов Pytorch и обратной функции, когда он обратно не раз в обратном направлении

Последнее сообщение Anonymous « 28 май 2025, 23:52
Добавлено в форуме Python

Anonymous » 28 май 2025, 23:52 » в форуме Python

Я пытаюсь добавить более одного шага обучения генератора за цикл в GAN, то есть я хочу, чтобы мой генератор обновлял его параметры n раз каждый m обновления дискриминатора, где n> m . for epoch in range(num_epochs):
for batch_idx, (real, _) in...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
28 май 2025, 23:52
Реализован ли s.rfind() в Python с использованием итераций в обратном направлении?

Последнее сообщение Anonymous « 02 июл 2024, 18:48
Добавлено в форуме Python

Anonymous » 02 июл 2024, 18:48 » в форуме Python

Выполняет ли rfind перебор строки от конца до начала?
Я прочитал документацию и посмотрите

str.rfind(sub[, start ])
Верните самый высокий индекс в строка, в которой находится подстрока sub, такая, что sub содержится в s . Необязательные аргументы...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 18:48
Реализован ли s.rfind() в Python с использованием итераций в обратном направлении?

Последнее сообщение Anonymous « 02 июл 2024, 21:51
Добавлено в форуме Python

Anonymous » 02 июл 2024, 21:51 » в форуме Python

Выполняет ли rfind перебор строки от конца до начала?
Я прочитал документацию и посмотрите

str.rfind(sub[, start ])
Верните самый высокий индекс в строка, в которой находится подстрока sub, такая, что sub содержится в s . Необязательные аргументы...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 21:51
Как вычислить временной интервал в обратном направлении в PHP

Последнее сообщение Anonymous « 16 июл 2024, 19:46
Добавлено в форуме Php

Anonymous » 16 июл 2024, 19:46 » в форуме Php

У меня есть PHP-коды, в которых я хотел вычислить разницу во времени между двумя заданными значениями времени.
// This is 2:00 am o'clock
$time1 = 02:00;

// This is 11 pm o'clock
$time2 = 21:00;

Я хочу получить разницу во времени между 2:00 и...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
16 июл 2024, 19:46
Стоимость вставки элемента в 0-ю позицию LinkedHashSet или мы можем повторить его в обратном направлении?

Последнее сообщение Anonymous « 03 окт 2024, 18:16
Добавлено в форуме JAVA

Anonymous » 03 окт 2024, 18:16 » в форуме JAVA

Я использую LinkedHashSet. Я хочу вставить элементы в 0-ю позицию, например:
Set set = new LinkedHashSet();
for (int i = 0; i < n; i++) {
set.add(0, blah + i);
}

Я не уверен, как реализован LinkedHashSet, будет ли вставка физически перемещать все...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 18:16

Вернуться в «Python»