Как точно рассчитать объем вычислений GFLOP, необходимый модели Deepseek R1 для вывода токена?Python

Программы на Python
Ответить
Anonymous
 Как точно рассчитать объем вычислений GFLOP, необходимый модели Deepseek R1 для вывода токена?

Сообщение Anonymous »

Я хочу оценить время вывода одного токена на собственном акселераторе. Но информации о MAC GFLOPS для одного токена нет.

Подробнее здесь: https://stackoverflow.com/questions/798 ... r-the-deep
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»