Память продолжает растут в петле обучения Pytorch, даже с ementle_cache ()Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Память продолжает растут в петле обучения Pytorch, даже с ementle_cache ()

Сообщение Anonymous »

У меня есть сценарий обучения Pytorch, и я получаю ошибку вне памяти после нескольких эпох, даже если я называю Torch.cuda.empty_cache () . Память графического процессора просто продолжает подниматься, и я не могу понять, почему. < /P>
Вот в основном то, что я делаю: < /p>

Код: Выделить всё

import torch
from torch.utils.data import Dataset, DataLoader
import numpy as np

class CustomDataset(Dataset):
def __init__(self, data_paths):
self.data_paths = data_paths

def __len__(self):
return len(self.data_paths)

def __getitem__(self, idx):
image = np.load(self.data_paths[idx]['image']).astype(np.float32)
label = np.load(self.data_paths[idx]['label']).astype(np.int64)

image = torch.tensor(image).cuda()
label = torch.tensor(label).cuda()

return image, label

data_paths = [{'image': f'img_{i}.npy', 'label': f'label_{i}.npy'} for i in range(10000)]
dataset = CustomDataset(data_paths)
dataloader = DataLoader(dataset, batch_size=32, num_workers=4, pin_memory=True)

for epoch in range(10):
for batch in dataloader:
images, labels = batch

output = images.mean()
loss = output.sum()
loss.backward()

del images, labels, loss, output
torch.cuda.empty_cache()
Даже после удаления всего и вызова empty_cache () VRAM просто продолжает подниматься, и я не понимаю, почему. Это не происходит на процессоре. Если я запускаю NVIDIA-SMI, использование памяти увеличивается после каждой партии, пока она не вылетит. Вызов del во всем после каждой партии
[*] Настройка num_workers = 0 (не помог)
[*] Использование .detach () Перед перемещением тензоров в GPU
[*] Проверьте, если проблема находится в моей модели, но даже без модели, просто загрузка данных уже делает увеличение памяти

Кто -нибудь видел это раньше? Есть ли что -то в DataLoader и Cuda () , что может вызвать это? Я не могу попробовать

Подробнее здесь: https://stackoverflow.com/questions/794 ... mpty-cache
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Память продолжает растут в петле обучения Pytorch, даже с ementle_cache ()
    Anonymous » » в форуме Python
    0 Ответы
    15 Просмотры
    Последнее сообщение Anonymous
  • Вызвано: java.lang.NullPointerException: невозможно вызвать «javax.cache.Cache.get(Object)», поскольку «this.cache» имее
    Anonymous » » в форуме JAVA
    0 Ответы
    52 Просмотры
    Последнее сообщение Anonymous
  • Spring Boot (Java 17) на Tomcat: память продолжает растут при горячих развертываниях (время jvm over 155 дней, куча нака
    Anonymous » » в форуме JAVA
    0 Ответы
    1 Просмотры
    Последнее сообщение Anonymous
  • Память монотонно растут в работе Spark
    Anonymous » » в форуме JAVA
    0 Ответы
    19 Просмотры
    Последнее сообщение Anonymous
  • Память монотонно растут в работе Spark
    Anonymous » » в форуме JAVA
    0 Ответы
    33 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»