Как я могу освободить память GPU NVIDIA, выделенную TensorFlow (2.17.0) в моем ноутбуке Jupyter? - Цифровое Кемерово

Как я могу освободить память GPU NVIDIA, выделенную TensorFlow (2.17.0) в моем ноутбуке Jupyter? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как я могу освободить память GPU NVIDIA, выделенную TensorFlow (2.17.0) в моем ноутбуке Jupyter?

Цитата

Сообщение Anonymous » 08 фев 2025, 17:15

У меня есть ноутбук Jupyter, работающий на ядре Opt/conda/bin/python в моей машине Google Compute Engine (Debian).
Первая ячейка моего ноутбука Загружает данные изображения с диска и сохраняет их в переменных Train_images, Train_labels и т. Д. Pre Class = "Lang-Py PrettyPrint-Override">

Код: Выделить всё

from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten, Input
from tensorflow.keras.optimizers import Adam

model.add(Input(shape=(img_size, img_size, 3)))
model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.4))
model.add(Dense(128, activation='relu'))
model.add(Dense(64, activation='relu'))
model.add(Dense(len(categories), activation='softmax'))
model.compile(optimizer=Adam(learning_rate=0.0001),
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])

history = model.fit(train_images,
train_labels,
epochs=20,
batch_size=32,
validation_data=(validate_images, validate_labels))
< /code>
Мой рабочий процесс запускает первую ячейку один раз, чтобы загрузить мои данные, а затем запустить вторую ячейку несколько раз, пробуя разные гиперпараметры. Однако, сделав это ~ 5 раз, я получаю: < /p>
2025-02-08 14:00:15.818993: W external/local_tsl/tsl/framework/bfc_allocator.cc:482] Allocator (GPU_0_bfc) ran out of memory trying to allocate 502MiB (rounded to 1207959552) requested by op StatelessRandomUniformV2
If the cause is memory fragmentation maybe the environment variable 'TF_GPU_ALLOCATOR=cuda_malloc_async' will improve the situation.

Я попробовал tf.keras.backend.clear_session () , gc.collect () и настройка Env var, как предложено в сообщении об ошибке, но Единственное, что работает, - это перезапуск ядра. Это очень раздражает, потому что загрузка данных в моей первой ячейке занимает довольно много времени, и я бы хотел сделать это только один раз. Из предыдущих выполнений ячейки или сбросить графический процессор? Мне не нужна выделенная память из старых испытаний, почему она накапливается? потом, но должен быть лучший способ.

Подробнее здесь: https://stackoverflow.com/questions/794 ... in-my-runn

Реклама

1739024157

Anonymous

 У меня есть ноутбук Jupyter, работающий на ядре Opt/conda/bin/python  в моей машине Google Compute Engine (Debian). 
Первая ячейка моего ноутбука Загружает данные изображения с диска и сохраняет их в переменных Train_images, Train_labels и т. Д. Pre Class = "Lang-Py PrettyPrint-Override">[code]from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten, Input
from tensorflow.keras.optimizers import Adam

model.add(Input(shape=(img_size, img_size, 3)))
model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.4))
model.add(Dense(128, activation='relu'))
model.add(Dense(64, activation='relu'))
model.add(Dense(len(categories), activation='softmax'))
model.compile(optimizer=Adam(learning_rate=0.0001),
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])

history = model.fit(train_images,
train_labels,
epochs=20,
batch_size=32,
validation_data=(validate_images, validate_labels))
< /code>
Мой рабочий процесс запускает первую ячейку один раз, чтобы загрузить мои данные, а затем запустить вторую ячейку несколько раз, пробуя разные гиперпараметры. Однако, сделав это ~ 5 раз, я получаю: < /p>
2025-02-08 14:00:15.818993: W external/local_tsl/tsl/framework/bfc_allocator.cc:482] Allocator (GPU_0_bfc) ran out of memory trying to allocate 502MiB (rounded to 1207959552) requested by op StatelessRandomUniformV2
If the cause is memory fragmentation maybe the environment variable 'TF_GPU_ALLOCATOR=cuda_malloc_async' will improve the situation.
[/code]
Я попробовал tf.keras.backend.clear_session () , gc.collect ()  и настройка Env var, как предложено в сообщении об ошибке, но Единственное, что работает, - это перезапуск ядра. Это очень раздражает, потому что загрузка данных в моей первой ячейке занимает довольно много времени, и я бы хотел сделать это только один раз. Из предыдущих выполнений ячейки или сбросить графический процессор? Мне не нужна выделенная память из старых испытаний, почему она накапливается? потом, но должен быть лучший способ.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79423322/how-can-i-free-the-nvidia-gpu-memory-allocated-by-tensorflow-2-17-0-in-my-runn[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

C освободить всю выделенную память одним вызовом free()

Последнее сообщение Anonymous « 29 фев 2024, 21:06
Добавлено в форуме Linux

Anonymous » 29 фев 2024, 21:06 » в форуме Linux

Я работаю с функцией C freeMemory(), которая получает на вход ряд указателей и освобождает занятую ими память следующим образом:

void freeMemory(char **parallel_commands, struct command *comands[], size_t num_parallel_commands) { бесплатно...

0 Ответы

37 Просмотры

Последнее сообщение Anonymous
29 фев 2024, 21:06
Как я могу освободить память, выделенную внешними вызовами C в Python?

Последнее сообщение Anonymous « 02 окт 2024, 14:29
Добавлено в форуме Python

Anonymous » 02 окт 2024, 14:29 » в форуме Python

TlDr: мой код Python выполняет вызовы внешней библиотеки C. Внутренне сценарии Python используют несколько сотен МБ ОЗУ, но внешние вызовы C используют много ГБ, даже когда мне больше не нужны данные, которые они вывели. Я хотел бы знать, как...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
02 окт 2024, 14:29
Как освободить память, выделенную opencv CV2

Последнее сообщение Anonymous « 06 дек 2024, 21:07
Добавлено в форуме Python

Anonymous » 06 дек 2024, 21:07 » в форуме Python

После того, как я использую эту функцию, я получаю выходные данные размером около 80 байт, но моя используемая память составляет 29 ГБ. После анализа памяти я вижу, что память heapmemoy и anon занимают много памяти. Я подозреваю, что CV2 выделяет...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
06 дек 2024, 21:07
Как освободить память, выделенную opencv CV2

Последнее сообщение Anonymous « 06 дек 2024, 22:10
Добавлено в форуме Python

Anonymous » 06 дек 2024, 22:10 » в форуме Python

После того, как я использую эту функцию, я получаю выходные данные размером около 13 ГБ, но моя используемая память составляет 29 ГБ. После анализа памяти я вижу, что память кучи и анон-память занимают много памяти. Я подозреваю, что CV2...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
06 дек 2024, 22:10
Должен ли я перейти на Linux, если на моем ноутбуке есть графический процессор NVIDIA? [закрыто]

Последнее сообщение Anonymous « 30 июл 2024, 05:20
Добавлено в форуме Linux

Anonymous » 30 июл 2024, 05:20 » в форуме Linux

Недавно я думал о переходе на Linux, но слышал, что Linux не очень поддерживает nvidia. Также я играю в гта 5 и вещи из стима. Повлияет ли это на игру?
Я еще не перешел на Linux, так как пользуюсь Windows. Я буду новичком в Linux

Подробнее здесь:

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 05:20

Вернуться в «Python»

Programmiererforum