Как работает расчет градиентной ленты TensorFlow на низком уровне? - Цифровое Кемерово

Как работает расчет градиентной ленты TensorFlow на низком уровне? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как работает расчет градиентной ленты TensorFlow на низком уровне?

Цитата

Сообщение Anonymous » 04 май 2025, 18:56

Я только что видел какой-то код, который вызвал мой интерес.

Код: Выделить всё

with tf.GradientTape() as g:
y = f(x)

dy_dx = g.gradient(y, x)
< /code>
(код свободно взят из этой ссылки.) Меня интересует понимание программного обеспечения, стоящего за тем, что может выглядеть как «Волшебный код». Вы можете задать такие вопросы, как 

 Почему здесь есть ключевое слово

? понимать. Это приводит к тому, что функции Magic Dunder __enter __ и __exit __ запускаются, и поэтому я совершенно уверен, что это удобный способ маркировки, где начало и конец расчета градиента. Я бы угадал , чтобы сделать общий код более эффективным - нет никакого смысла вычислять градиенты, если они не нужны, и поэтому нам нужен способ отметить, где мы должны начать и закончить расчеты градиента. API мог бы также выставить .start () и .stop () function.
Вторая точка менее проста для понимания. Мое первоначальное предположение состояло в том, что, возможно, градиенты были аппроксимированы численно. Однако, проведя некоторые исследования, я понимаю, что это не так, и вместо этого используется что -то, что называется автоматической дифференциацией . Численные методы страдают от численных ошибок из -за конечной точности, поэтому неудивительно, что потенциально численное нестабильное алгоритм здесь не используется. < /P>
Я не понимаю, как подключить точки. Контекстный диспетчер используется для обозначения начала и окончания того, где должны быть выполнены некоторые расчеты градиента, и эти расчеты рассчитываются с использованием автоматической дифференциации. Я понимаю, что цепное правило используется, но это не символическая дифференциация. Так что же делает Tensorflow здесь? (Прочитав некоторые ссылки на Auto Diff, я не вижу, как это отличается от применения правил цепочки символической дифференциации. Так что, возможно, я что-то упускаю здесь.) < /P>

Это эффективно имеет большой список операторов If-elseif < /code> для расчета правильной функции? Например, если TensorFlow видит выражение, такое как Matmul (x, y) , содержит ли он просто логические правила, в которых говорится, что d_matmul_d_arg1 = arg2 и d_matmul_d_arg2 = arg1 ? d_matmul_d_arg1 (arg2) так же, как и вычисляет значение Matmul (x, y) с x = ... , y = ... использование обычного численного алгоритма для умножения матрицы? Уровень?

Подробнее здесь: https://stackoverflow.com/questions/796 ... -low-level

Реклама

1746374201

Anonymous

Я только что видел какой-то код, который вызвал мой интерес.[code]with tf.GradientTape() as g:
y = f(x)

dy_dx = g.gradient(y, x)
< /code>
(код свободно взят из этой ссылки.) Меня интересует понимание программного обеспечения, стоящего за тем, что может выглядеть как «Волшебный код». Вы можете задать такие вопросы, как

Почему здесь есть ключевое слово [/code]? понимать. Это приводит к тому, что функции Magic Dunder __enter __ и __exit __ запускаются, и поэтому я совершенно уверен, что это удобный способ маркировки, где начало и конец расчета градиента. Я бы угадал , чтобы сделать общий код более эффективным - нет никакого смысла вычислять градиенты, если они не нужны, и поэтому нам нужен способ отметить, где мы должны начать и закончить расчеты градиента. API мог бы также выставить .start () и .stop () function.
Вторая точка менее проста для понимания. Мое первоначальное предположение состояло в том, что, возможно, градиенты были аппроксимированы численно. Однако, проведя некоторые исследования, я понимаю, что это не так, и вместо этого используется что -то, что называется автоматической дифференциацией . Численные методы страдают от численных ошибок из -за конечной точности, поэтому неудивительно, что потенциально численное нестабильное алгоритм здесь не используется. < /P>
Я не понимаю, как подключить точки. Контекстный диспетчер используется для обозначения начала и окончания того, где должны быть выполнены некоторые расчеты градиента, и эти расчеты рассчитываются с использованием автоматической дифференциации. Я понимаю, что цепное правило используется, но это [b] не [/b] символическая дифференциация. Так что же делает Tensorflow здесь? (Прочитав некоторые ссылки на Auto Diff, я не вижу, как это отличается от применения правил цепочки символической дифференциации. Так что, возможно, я что-то упускаю здесь.) < /P>

Это эффективно имеет большой список операторов If-elseif < /code> для расчета правильной функции? Например, если TensorFlow видит выражение, такое как Matmul (x, y) , содержит ли он просто логические правила, в которых говорится, что d_matmul_d_arg1 = arg2 и d_matmul_d_arg2 = arg1 ? d_matmul_d_arg1 (arg2) так же, как и вычисляет значение Matmul (x, y) с x = ... , y = ... использование обычного численного алгоритма для умножения матрицы? Уровень?

Подробнее здесь: [url]https://stackoverflow.com/questions/79604798/how-does-the-tensorflow-gradient-tape-calculation-work-at-a-low-level[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как работает расчет градиентной ленты TensorFlow на низком уровне?

Последнее сообщение Anonymous « 03 май 2025, 17:25
Добавлено в форуме Python

Anonymous » 03 май 2025, 17:25 » в форуме Python

Я только что видел какой-то код, который вызвал мой интерес. with tf.GradientTape() as g:
y = f(x)

dy_dx = g.gradient(y, x)

(код свободно взят из этой ссылки.) Меня интересует понимание программного обеспечения, стоящего за тем, что может...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
03 май 2025, 17:25
Как работает расчет градиентной ленты TensorFlow на низком уровне?

Последнее сообщение Anonymous « 04 май 2025, 17:59
Добавлено в форуме Python

Anonymous » 04 май 2025, 17:59 » в форуме Python

Я только что видел какой-то код, который вызвал мой интерес. with tf.GradientTape() as g:
y = f(x)

dy_dx = g.gradient(y, x)

(код свободно взят из этой ссылки.) Меня интересует понимание программного обеспечения, стоящего за тем, что может...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
04 май 2025, 17:59
Как создать текст с градиентной заливкой, градиентной встроенной обводкой и внутренней тенью?

Последнее сообщение Anonymous « 01 июл 2024, 16:11
Добавлено в форуме CSS

Anonymous » 01 июл 2024, 16:11 » в форуме CSS

У меня проблема с CSS. Я хочу создать текст из дизайна Figma. Этот текст находится на изображении, которое я прикрепил ниже. Он должен иметь следующие свойства:

Размер Poppins 48 пикселей и толщина шрифта 600.
Линейная градиентная заливка: фон:...

0 Ответы

37 Просмотры

Последнее сообщение Anonymous
01 июл 2024, 16:11
Тайм-аут опроса потребителей Kafka при низком уровне обработки

Последнее сообщение Anonymous « 12 окт 2024, 20:08
Добавлено в форуме JAVA

Anonymous » 12 окт 2024, 20:08 » в форуме JAVA

Версия брокера Kafka: 2.6.2
Клиент Apache Kafka Java: 3.0.0
На прошлой неделе было несколько случаев, когда все потребители определенной группы потребителей продолжали умирать. с ошибкой:
consumer poll timeout has expired. This means the time...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
12 окт 2024, 20:08
Создает ли Crashlytics отчет о сбое при низком прекращении приложения памяти (iOS)?

Последнее сообщение Anonymous « 28 апр 2025, 12:14
Добавлено в форуме IOS

Anonymous » 28 апр 2025, 12:14 » в форуме IOS

Crashlytics генерирует отчет о сбое, когда система завершает применение iOS при низком условии памяти, а приложение находится в:

fanight
передний план

Подробнее здесь:

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
28 апр 2025, 12:14

Вернуться в «Python»

Programmiererforum