Уменьшение памяти Tensorflow TPU v2/v3 bfloat16Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Уменьшение памяти Tensorflow TPU v2/v3 bfloat16

Сообщение Anonymous »

Моя модель слишком велика, чтобы получить партию >64 с обычными устройствами TPU v2. На сайте устранения неполадок упоминается, что в будущих версиях tensorflow будет поддержка bfloat16. Могут ли недавно поддерживаемые версии tf 1.9–1.12 использовать bfloat16, и если да, то есть ли ограниченный набор оптимизаторов, которые я могу использовать? Я не нашел никакой дополнительной документации по этому вопросу, но видел использование bfloat16 в модели tensor2tensor, так что я думаю, что должен быть способ.

Кроме того, я читал, что TPU v3 поддерживает и более крупные модели, но модель потребует минимальных изменений, но я не нашел документации о том, что нужно изменить.

Я уже использую Adafactor и Попробовал уменьшить мои слои, если у вас есть еще какие-нибудь советы по уменьшению, это тоже было бы здорово. В качестве входных данных я использую матрицы изображений и векторы слов (на данный момент float32).

Подробнее здесь: https://stackoverflow.com/questions/534 ... 3-bfloat16
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Ошибка выполнения TPU V4-64: не удалось инициализировать TPU: не удалось установить канал grpc SliceBuilder
    Anonymous » » в форуме Python
    0 Ответы
    33 Просмотры
    Последнее сообщение Anonymous
  • Проблема с Tensorflow TPU Kaggle
    Anonymous » » в форуме Python
    0 Ответы
    14 Просмотры
    Последнее сообщение Anonymous
  • Ошибка TPU v3-8 TensorFlow CrossReplicaSum
    Anonymous » » в форуме Python
    0 Ответы
    17 Просмотры
    Последнее сообщение Anonymous
  • Использование bfloat16 и tensorflow на графическом процессоре
    Anonymous » » в форуме Python
    0 Ответы
    30 Просмотры
    Последнее сообщение Anonymous
  • Отсутствует 0-й вывод узла... При попытке использовать bfloat16 в tensorflow 2
    Anonymous » » в форуме Python
    0 Ответы
    11 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»