Уменьшение памяти Tensorflow TPU v2/v3 bfloat16

Уменьшение памяти Tensorflow TPU v2/v3 bfloat16 ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Уменьшение памяти Tensorflow TPU v2/v3 bfloat16

Цитата

Сообщение Anonymous » 30 июн 2024, 01:21

Моя модель слишком велика, чтобы получить партию >64 с обычными устройствами TPU v2. На сайте устранения неполадок упоминается, что в будущих версиях tensorflow будет поддержка bfloat16. Могут ли недавно поддерживаемые версии tf 1.9–1.12 использовать bfloat16, и если да, то есть ли ограниченный набор оптимизаторов, которые я могу использовать? Я не нашел никакой дополнительной документации по этому вопросу, но видел использование bfloat16 в модели tensor2tensor, так что я думаю, что должен быть способ.

Кроме того, я читал, что TPU v3 поддерживает и более крупные модели, но модель потребует минимальных изменений, но я не нашел документации о том, что нужно изменить.

Я уже использую Adafactor и Попробовал уменьшить мои слои, если у вас есть еще какие-нибудь советы по уменьшению, это тоже было бы здорово. В качестве входных данных я использую матрицы изображений и векторы слов (на данный момент float32).

Подробнее здесь: https://stackoverflow.com/questions/534 ... 3-bfloat16

1719699696

Anonymous

Моя модель слишком велика, чтобы получить партию >64 с обычными устройствами TPU v2. На сайте устранения неполадок упоминается, что в будущих версиях tensorflow будет поддержка bfloat16. Могут ли недавно поддерживаемые версии tf 1.9–1.12 использовать bfloat16, и если да, то есть ли ограниченный набор оптимизаторов, которые я могу использовать? Я не нашел никакой дополнительной документации по этому вопросу, но видел использование bfloat16 в модели tensor2tensor, так что я думаю, что должен быть способ.

Кроме того, я читал, что TPU v3 поддерживает и более крупные модели, но модель потребует минимальных изменений, но я не нашел документации о том, что нужно изменить.

Я уже использую Adafactor и Попробовал уменьшить мои слои, если у вас есть еще какие-нибудь советы по уменьшению, это тоже было бы здорово. В качестве входных данных я использую матрицы изображений и векторы слов (на данный момент float32).  

Подробнее здесь: [url]https://stackoverflow.com/questions/53458833/memory-reduction-tensorflow-tpu-v2-v3-bfloat16[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ошибка выполнения TPU V4-64: не удалось инициализировать TPU: не удалось установить канал grpc SliceBuilder

Последнее сообщение Anonymous « 06 июл 2024, 13:24
Добавлено в форуме Python

Anonymous » 06 июл 2024, 13:24 » в форуме Python

Во время исследовательской программы TPU я пытался использовать TPU V4-64 , поскольку у меня есть 32 бесплатных чипа TPU V4, которые можно заказать по запросу.
Однако, в отличие от TPU V4-8, тестовые коды, представленные в руководстве, не работали...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
06 июл 2024, 13:24
Проблема с Tensorflow TPU Kaggle

Последнее сообщение Anonymous « 01 янв 2024, 19:45
Добавлено в форуме Python

Anonymous » 01 янв 2024, 19:45 » в форуме Python

Я работаю над ноутбуком в Kaggle и пытаюсь подключиться к ТПУ. Когда я проверяю, подключился ли я к TPU с помощью этого кода:

AUTO = tf.data.experimental.AUTOTUNE # Обнаружение TPU, возвращение соответствующей стратегии распределения пытаться: tpu...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
01 янв 2024, 19:45
Ошибка TPU v3-8 TensorFlow CrossReplicaSum

Последнее сообщение Anonymous « 18 май 2024, 19:07
Добавлено в форуме Python

Anonymous » 18 май 2024, 19:07 » в форуме Python

Я получаю эту ошибку, когда устанавливаю свою модель.
tensorflow/core/tpu/kernels/tpu_compilation_cache_external.cc:112] Asked to propagate a dynamic dimension from hlo transpose.3750@{}@0 to hlo %all-reduce.3755 = f32[

Подробнее здесь:

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
18 май 2024, 19:07
Использование bfloat16 и tensorflow на графическом процессоре

Последнее сообщение Anonymous « 30 июн 2024, 01:19
Добавлено в форуме Python

Anonymous » 30 июн 2024, 01:19 » в форуме Python

Почему-то, когда я использую bfloat16, tensorflow не может обнаружить мой графический процессор.

Можно ли использовать bfloat16 на графическом процессоре? Или я могу использовать bfloat16 только в тензорном процессоре?

Означает ли сообщение об...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
30 июн 2024, 01:19
Отсутствует 0-й вывод узла... При попытке использовать bfloat16 в tensorflow 2

Последнее сообщение Anonymous « 30 июн 2024, 01:22
Добавлено в форуме Python

Anonymous » 30 июн 2024, 01:22 » в форуме Python

Итак, я пытаюсь преобразовать существующий проект для использования bfloat16, поскольку это позволяет коду работать на тензорных ядрах. Я использую mix_precision.set_global_policy('mixed_bfloat16'), которого, согласно документации keras, достаточно...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
30 июн 2024, 01:22

Вернуться в «Python»