Tensorflow: что делает output_gradient в GradientTape().gradient? - Цифровое Кемерово

Tensorflow: что делает output_gradient в GradientTape().gradient? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Tensorflow: что делает output_gradient в GradientTape().gradient?

Цитата

Сообщение Anonymous » 01 июл 2024, 10:18

Мне было интересно, что делает аргумент output_gradients в функции градиента объекта GradientTape в тензорном потоке. Согласно https://www.tensorflow.org/api_docs/pyt ... e#gradient, эта переменная должна содержать «список градиентов, по одному для каждого дифференцируемого элемента цели».
Ее значение по умолчанию — None. .
Не очень понятно, что именно это делает.
Когда я опускаю аргумент, функция вычисляет якобиан относительно некоторой функции , например z None:
gamma = 1
xi_transform = gpflow.optimizers.natgrad.XiNat()

dL_dmean = gpflow.base._to_constrained(q_mu_grad, q_mu.transform)
dL_dvarsqrt = gpflow.base._to_constrained(q_sqrt_grad, q_sqrt.transform)

with tf.GradientTape(persistent=True, watch_accessed_variables=False) as tape:
tape.watch([q_mu.unconstrained_variable, q_sqrt.unconstrained_variable])
eta1, eta2 = gpflow.optimizers.natgrad.meanvarsqrt_to_expectation(q_mu, q_sqrt)
meanvarsqrt = gpflow.optimizers.natgrad.expectation_to_meanvarsqrt(eta1, eta2)

dL_deta1, dL_deta2 = tape.gradient(
meanvarsqrt, [eta1, eta2], output_gradients=[dL_dmean, dL_dvarsqrt]
)

dtheta_deta1, dtheta_deta2 = tape.gradient(
meanvarsqrt, [eta1, eta2], output_gradients=None
)

return dL_deta1, dL_deta2, dtheta_deta1, dtheta_deta2

X_data = tf.ones(5)
num_latent_gps = 1
static_num_data = X_data.shape[0]
q_sqrt_unconstrained_shape = (num_latent_gps, gpflow.utilities.triangular_size(static_num_data))
num_data = gpflow.Parameter(tf.shape(X_data)[0], shape=[], dtype=tf.int32, trainable=False)
dynamic_num_data = tf.convert_to_tensor(num_data)

mu = np.array([[0.93350756], [0.15833747], [0.23830378], [0.28742445], [0.14999759]])
q_mu = gpflow.Parameter(mu, shape=(static_num_data, num_latent_gps))
q_sqrt = tf.eye(dynamic_num_data, batch_shape=[num_latent_gps])
q_sqrt = gpflow.Parameter(
q_sqrt,
transform=gpflow.utilities.triangular(),
unconstrained_shape=q_sqrt_unconstrained_shape,
constrained_shape=(num_latent_gps, static_num_data, static_num_data),
)

q_mu_grad = q_mu.unconstrained_variable * 0.33
q_sqrt_grad = q_sqrt.unconstrained_variable

dL_deta1, dL_deta2, dtheta_deta1, dtheta_deta2 = natgrad_apply_gradients(q_mu_grad, q_sqrt_grad, q_mu, q_sqrt)

dL_deta1 !== dtheta_deta1 * q_mu_grad
[/code]
Надеюсь, что кто-нибудь знает и заранее благодарен!

Подробнее здесь: https://stackoverflow.com/questions/786 ... e-gradient

Реклама

1719818316

Anonymous

Мне было интересно, что делает аргумент output_gradients в функции градиента объекта GradientTape в тензорном потоке. Согласно https://www.tensorflow.org/api_docs/python/tf/GradientTape#gradient, эта переменная должна содержать «список градиентов, по одному для каждого дифференцируемого элемента цели».
Ее значение по умолчанию — None. .
Не очень понятно, что именно это делает.
Когда я опускаю аргумент, функция вычисляет якобиан относительно некоторой функции , например z  None:
gamma = 1
xi_transform = gpflow.optimizers.natgrad.XiNat()

dL_dmean = gpflow.base._to_constrained(q_mu_grad, q_mu.transform)
dL_dvarsqrt = gpflow.base._to_constrained(q_sqrt_grad, q_sqrt.transform)

with tf.GradientTape(persistent=True, watch_accessed_variables=False) as tape:
tape.watch([q_mu.unconstrained_variable, q_sqrt.unconstrained_variable])
eta1, eta2 = gpflow.optimizers.natgrad.meanvarsqrt_to_expectation(q_mu, q_sqrt)
meanvarsqrt = gpflow.optimizers.natgrad.expectation_to_meanvarsqrt(eta1, eta2)

dL_deta1, dL_deta2 = tape.gradient(
meanvarsqrt, [eta1, eta2], output_gradients=[dL_dmean, dL_dvarsqrt]
)

dtheta_deta1, dtheta_deta2 = tape.gradient(
meanvarsqrt, [eta1, eta2], output_gradients=None
)

return dL_deta1, dL_deta2, dtheta_deta1, dtheta_deta2

X_data = tf.ones(5)
num_latent_gps = 1
static_num_data = X_data.shape[0]
q_sqrt_unconstrained_shape = (num_latent_gps, gpflow.utilities.triangular_size(static_num_data))
num_data = gpflow.Parameter(tf.shape(X_data)[0], shape=[], dtype=tf.int32, trainable=False)
dynamic_num_data = tf.convert_to_tensor(num_data)

mu = np.array([[0.93350756], [0.15833747], [0.23830378], [0.28742445], [0.14999759]])
q_mu = gpflow.Parameter(mu, shape=(static_num_data, num_latent_gps))
q_sqrt = tf.eye(dynamic_num_data, batch_shape=[num_latent_gps])
q_sqrt = gpflow.Parameter(
q_sqrt,
transform=gpflow.utilities.triangular(),
unconstrained_shape=q_sqrt_unconstrained_shape,
constrained_shape=(num_latent_gps, static_num_data, static_num_data),
)

q_mu_grad = q_mu.unconstrained_variable * 0.33
q_sqrt_grad = q_sqrt.unconstrained_variable

dL_deta1, dL_deta2, dtheta_deta1, dtheta_deta2 = natgrad_apply_gradients(q_mu_grad, q_sqrt_grad, q_mu, q_sqrt)

dL_deta1 !== dtheta_deta1 * q_mu_grad
[/code]
Надеюсь, что кто-нибудь знает и заранее благодарен!
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78689813/tensorflow-what-does-output-gradient-do-in-gradienttape-gradient[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Что делает output_gradient в GradientTape().gradient?

Последнее сообщение Anonymous « 01 июл 2024, 18:55
Добавлено в форуме Python

Anonymous » 01 июл 2024, 18:55 » в форуме Python

Мне было интересно, что делает аргумент output_gradients в функции градиента объекта GradientTape в тензорном потоке. Согласно эта переменная должна содержать «список градиентов, по одному для каждого дифференцируемого элемента цели».
Ее значение по...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
01 июл 2024, 18:55
ValueError: аргументы «target» и «output» должны иметь одинаковую форму. Получено: target.shape=(Нет, 512), output.shape

Последнее сообщение Anonymous « 13 май 2024, 10:32
Добавлено в форуме Python

Anonymous » 13 май 2024, 10:32 » в форуме Python

Я пытался обучить модель bert для решения проблемы мультиклассификации:

Я получил эту ошибку при запуске кода ниже

Целевой и выходной аргументы должны иметь одинаковую форму. Получено: target.shape=(Нет, 512), output.shape=(Нет, 3)

import...

0 Ответы

181 Просмотры

Последнее сообщение Anonymous
13 май 2024, 10:32
Аргументы `target` и` output 'должны иметь одинаковый ранг (ndim). Получено: target.shape = (none,), output.shape = (нет

Последнее сообщение Anonymous « 14 апр 2025, 00:09
Добавлено в форуме Python

Anonymous » 14 апр 2025, 00:09 » в форуме Python

Я пытался создать нейронную сеть, которая может идентифицировать изображения, но когда я иду и пытаюсь подготовить свою модель, я получаю следующую ошибку:
ValueError Traceback (most recent call last)
in ()
1 # Train the model
----> 2 history =...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
14 апр 2025, 00:09
Ошибка TensorFlow GradientTape «Внутри его контекста значительно менее эффективна, чем называть ее вне контекста»?

Последнее сообщение Anonymous « 24 фев 2025, 16:17
Добавлено в форуме Python

Anonymous » 24 фев 2025, 16:17 » в форуме Python

В настоящее время я работаю над состязательными атаками на наборе данных изображений. Наиболее важными библиотеками в моем проекте являются:

Tensorflow 2.10.1 (с CUDA) (ошибка с TensorFlow)
pytorch 1.13.1+cu116
art (состязательная...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
24 фев 2025, 16:17
Ошибка TensorFlow GradientTape «Внутри его контекста значительно менее эффективна, чем называть ее вне контекста»?

Последнее сообщение Anonymous « 24 фев 2025, 21:05
Добавлено в форуме Python

Anonymous » 24 фев 2025, 21:05 » в форуме Python

В настоящее время я работаю над состязательными атаками на наборе данных изображений. Наиболее важными библиотеками в моем проекте являются:

Tensorflow 2.10.1 (с CUDA) (ошибка с TensorFlow)
pytorch 1.13.1+cu116
art (состязательная...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
24 фев 2025, 21:05

Вернуться в «Python»

Programmiererforum