В чем разница между различными бэкэндами в torch.nn.attention.SDPBackend и что они означают? - Цифровое Кемерово

В чем разница между различными бэкэндами в torch.nn.attention.SDPBackend и что они означают? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

В чем разница между различными бэкэндами в torch.nn.attention.SDPBackend и что они означают?

Цитата

Сообщение Anonymous » 08 ноя 2024, 03:50

В документации pytorch по SDPBackend есть несколько перечислений, доступных для использования с менеджером контекста.
ОШИБКА: произошла ошибка при попытке определить серверную часть.

MATH: математический механизм для масштабирования внимания скалярного произведения.

FLASH_ATTENTION: механизм мгновенного внимания для масштабированного внимания скалярного произведения.

EFFICIENT_ATTENTION: эффективный механизм внимания для масштабированное внимание к скалярному произведению.

CUDNN_ATTENTION: серверная часть cuDNN для масштабированного внимания к скалярному произведению.
Что они означают и чем они отличаются?Что такое бэкэнд EFFICIENT ATTENTION? И еще: я проверил с помощью torch.backends.cuda.flash_sdp_enabled() на машине без графического процессора, и это правда, но разве флэш-внимание не должно быть предназначено только для графических процессоров и основано на использовании кэш-памяти графического процессора? Является ли эффективное внимание всего лишь вспышкой внимания 2?

Подробнее здесь: https://stackoverflow.com/questions/791 ... sdpbackend

1731027021

Anonymous

В документации pytorch по SDPBackend есть несколько перечислений, доступных для использования с менеджером контекста.
ОШИБКА: произошла ошибка при попытке определить серверную часть.

MATH: математический механизм для масштабирования внимания скалярного произведения.

FLASH_ATTENTION: механизм мгновенного внимания для масштабированного внимания скалярного произведения.

EFFICIENT_ATTENTION: эффективный механизм внимания для масштабированное внимание к скалярному произведению.

CUDNN_ATTENTION: серверная часть cuDNN для масштабированного внимания к скалярному произведению.
Что они означают и чем они отличаются?Что такое бэкэнд EFFICIENT ATTENTION? И еще: я проверил с помощью torch.backends.cuda.flash_sdp_enabled() на машине без графического процессора, и это правда, но разве флэш-внимание не должно быть предназначено только для графических процессоров и основано на использовании кэш-памяти графического процессора? Является ли эффективное внимание всего лишь вспышкой внимания 2? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79167465/what-is-the-difference-between-various-backends-in-torch-nn-attention-sdpbackend[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»