Аномальное использование памяти CUDA и CPU с трансформаторами guggingface transformers vit-msn

Аномальное использование памяти CUDA и CPU с трансформаторами guggingface transformers vit-msn ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Аномальное использование памяти CUDA и CPU с трансформаторами guggingface transformers vit-msn

Цитата

Сообщение Anonymous » 27 янв 2025, 02:56

В основном есть две части к вопросу, первая часть заключается в том, что, выводя вывод на модели и сохраняя минимальные результаты, приложение Python занимает около 3 ГБ памяти в моей системе (у меня жестко кодированное устройство = 'ЦП'), Это неожиданно, так как модель представляет собой модель Vit-MSN-базы с 12 слоями и размером около 160 МБ, мой размер партии составляет 1 .. Также, даже при использовании gc.collect (), кажется, что использование памяти просто продолжает увеличивать < /p>
Вторая часть заключается в том, что использование памяти приводит к примерно 10 ГБ, когда я использую Device = 'cuda', это было действительно неожиданно, на некотором поиске, похоже, результаты обработки памяти Pytorch В обширной фрагментации, но я не уверен в том, как справиться с этим < /p>
Вот соответствующие фрагменты кода -< /p>
model_name = 'facebook/vit-msn-base-4'
layers = 1
< /code>
cka_score_list = []

tokenizer = AutoImageProcessor.from_pretrained(
model_name,
use_fast=True, # Use the fast tokenizer implementation
trust_remote_code=True, # Trust remote code (required for some models)
add_bos_token=False, # Do not add beginning-of-sequence token
add_eos_token=False, # Do not add end-of-sequence token
padding_side="left" # Pad sequences on the left side
)

# Load the pre-trained causal language model with appropriate settings
model = AutoModel.from_pretrained(
model_name,
trust_remote_code=True, # Trust remote code (required for some models)
device_map="auto", # Automatically map layers to available devices
torch_dtype=torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float32, # Use bfloat16 if supported
)
print(dir(model))
model.eval()
model = model.to(device)
cur_score = eval_meth(classA, classB, num_images)

cka_score_list.append(cur_score)
< /code>
def latent_embeddings_for_class(classA, num_images):
cur_csv = os.path.join(val_csv , (classA+ '.csv'))
df = pd.read_csv(cur_csv, header = None)
embeddings = []
for i in range(num_images):
image_name = df.iloc[random.randint(1, 50), 0]
image_path = os.path.join(val_images, image_name)
image =Image.open(image_path)

inputs = tokenizer(image, return_tensors="pt").to(device).to(torch.bfloat16)
print(inputs['pixel_values'].shape)
snapshot = tracemalloc.take_snapshot()

# Print top memory-consuming lines
top_stats = snapshot.statistics('lineno')
for stat in top_stats[:3]:
print(stat)

output = model(**inputs)
embeddings.append(output.last_hidden_state[0,1])

del inputs
del image
del output
clear_memory()

print(embeddings[0].shape)

embeddings = torch.stack(embeddings)
return embeddings

def eval_meth(classA, classB, num_images ):

X= latent_embeddings_for_class( classA, num_images)
Y= latent_embeddings_for_class( classB, num_images)

cka_score = cka(X,Y)
clear_memory()
return cka_score
< /code>
also, on CPU, this is the output -
torch.Size([1, 3, 224, 224])
:647: size=3355 KiB, count=19535, average=176 B
c:\Users\hp\miniconda3\envs\mka_research\lib\ast.py:50: size=661 KiB, count=11348, average=60 B
c:\Users\hp\miniconda3\envs\mka_research\lib\selectors.py:315: size=288 KiB, count=6, average=48.0 KiB
torch.Size([768])
torch.Size([1, 3, 224, 224])
:647: size=3355 KiB, count=19535, average=176 B
c:\Users\hp\miniconda3\envs\mka_research\lib\ast.py:50: size=661 KiB, count=11348, average=60 B
c:\Users\hp\miniconda3\envs\mka_research\lib\tracemalloc.py:505: size=537 KiB, count=9815, average=56 B
torch.Size([768])
torch.Size([1, 3, 224, 224])
:647: size=3355 KiB, count=19535, average=176 B
c:\Users\hp\miniconda3\envs\mka_research\lib\ast.py:50: size=661 KiB, count=11348, average=60 B
c:\Users\hp\miniconda3\envs\mka_research\lib\tracemalloc.py:505: size=533 KiB, count=9732, average=56 B
torch.Size([768])
< /code>
on GPU it shows -
CUDA out of memory. Tried to allocate 452.00 MiB. GPU 0 has a total capacity of 4.00 GiB of which 0 bytes is free. Of the allocated memory 10.17 GiB is allocated by PyTorch, and 144.56 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation. See documentation for Memory Management (https://pytorch.org/docs/stable/notes/c ... -variables)
< /code>
this is weird as this does not reflect the memory usage shown in task manager

Подробнее здесь: https://stackoverflow.com/questions/793 ... -msn-model

1737935807

Anonymous

 В основном есть две части к вопросу, первая часть заключается в том, что, выводя вывод на модели и сохраняя минимальные результаты, приложение Python занимает около 3 ГБ памяти в моей системе (у меня жестко кодированное устройство = 'ЦП'), Это неожиданно, так как модель представляет собой модель Vit-MSN-базы с 12 слоями и размером около 160 МБ, мой размер партии составляет 1 .. Также, даже при использовании gc.collect (), кажется, что использование памяти просто продолжает увеличивать < /p>
Вторая часть заключается в том, что использование памяти приводит к примерно 10 ГБ, когда я использую Device = 'cuda', это было действительно неожиданно, на некотором поиске, похоже, результаты обработки памяти Pytorch В обширной фрагментации, но я не уверен в том, как справиться с этим < /p>
Вот соответствующие фрагменты кода -< /p>
model_name  = 'facebook/vit-msn-base-4'
layers = 1
< /code>
cka_score_list = []

tokenizer = AutoImageProcessor.from_pretrained(
model_name,
use_fast=True,             # Use the fast tokenizer implementation
trust_remote_code=True,    # Trust remote code (required for some models)
add_bos_token=False,       # Do not add beginning-of-sequence token
add_eos_token=False,       # Do not add end-of-sequence token
padding_side="left"        # Pad sequences on the left side
)

# Load the pre-trained causal language model with appropriate settings
model = AutoModel.from_pretrained(
model_name,
trust_remote_code=True,    # Trust remote code (required for some models)
device_map="auto",         # Automatically map layers to available devices
torch_dtype=torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float32,  # Use bfloat16 if supported
)
print(dir(model))
model.eval()
model = model.to(device)
cur_score = eval_meth(classA, classB, num_images)

cka_score_list.append(cur_score)
< /code>
def latent_embeddings_for_class(classA, num_images):
cur_csv = os.path.join(val_csv , (classA+ '.csv'))
df = pd.read_csv(cur_csv, header = None)
embeddings = []
for i in range(num_images):
image_name = df.iloc[random.randint(1, 50), 0]
image_path = os.path.join(val_images, image_name)
image =Image.open(image_path)

inputs = tokenizer(image, return_tensors="pt").to(device).to(torch.bfloat16)
print(inputs['pixel_values'].shape)
snapshot = tracemalloc.take_snapshot()

# Print top memory-consuming lines
top_stats = snapshot.statistics('lineno')
for stat in top_stats[:3]:
print(stat)

output = model(**inputs)
embeddings.append(output.last_hidden_state[0,1])

del inputs
del image
del output
clear_memory()

print(embeddings[0].shape)

embeddings = torch.stack(embeddings)
return embeddings

def eval_meth(classA, classB, num_images ):

X= latent_embeddings_for_class( classA, num_images)
Y= latent_embeddings_for_class( classB, num_images)

cka_score = cka(X,Y)
clear_memory()
return cka_score
< /code>
also, on CPU, this is the output -
torch.Size([1, 3, 224, 224])
:647: size=3355 KiB, count=19535, average=176 B
c:\Users\hp\miniconda3\envs\mka_research\lib\ast.py:50: size=661 KiB, count=11348, average=60 B
c:\Users\hp\miniconda3\envs\mka_research\lib\selectors.py:315: size=288 KiB, count=6, average=48.0 KiB
torch.Size([768])
torch.Size([1, 3, 224, 224])
:647: size=3355 KiB, count=19535, average=176 B
c:\Users\hp\miniconda3\envs\mka_research\lib\ast.py:50: size=661 KiB, count=11348, average=60 B
c:\Users\hp\miniconda3\envs\mka_research\lib\tracemalloc.py:505: size=537 KiB, count=9815, average=56 B
torch.Size([768])
torch.Size([1, 3, 224, 224])
:647: size=3355 KiB, count=19535, average=176 B
c:\Users\hp\miniconda3\envs\mka_research\lib\ast.py:50: size=661 KiB, count=11348, average=60 B
c:\Users\hp\miniconda3\envs\mka_research\lib\tracemalloc.py:505: size=533 KiB, count=9732, average=56 B
torch.Size([768])
< /code>
on GPU it shows -
CUDA out of memory. Tried to allocate 452.00 MiB. GPU 0 has a total capacity of 4.00 GiB of which 0 bytes is free. Of the allocated memory 10.17 GiB is allocated by PyTorch, and 144.56 MiB is reserved by PyTorch but unallocated.  If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)
< /code>
this is weird as this does not reflect the memory usage shown in task manager 

Подробнее здесь: [url]https://stackoverflow.com/questions/79389502/abnormal-cuda-and-cpu-memory-usage-with-huggingface-transformers-vit-msn-model[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ненормальное использование памяти cuda и процессора с помощью преобразователей Huggingface, модель ViT-msn

Последнее сообщение Anonymous « 27 янв 2025, 03:51
Добавлено в форуме Python

Anonymous » 27 янв 2025, 03:51 » в форуме Python

В основном есть две части к вопросу, первая часть заключается в том, что, выводя вывод на модели и сохраняя минимальные результаты, приложение Python занимает около 3 ГБ памяти в моей системе (у меня жестко кодированное устройство = 'ЦП'), Это...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
27 янв 2025, 03:51
Аномальное использование памяти QVector

Последнее сообщение Anonymous « 06 мар 2024, 11:43
Добавлено в форуме C++

Anonymous » 06 мар 2024, 11:43 » в форуме C++

I few years back I tested QVector and std::vector side by side, and was living with the impression the two are in the same ballpark of performance, in fact in some cases QVector was edging out.

Until yesterday, when I ran a quick compliance test...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
06 мар 2024, 11:43
Аномальное использование памяти QVector

Последнее сообщение Anonymous « 06 мар 2024, 13:31
Добавлено в форуме C++

Anonymous » 06 мар 2024, 13:31 » в форуме C++

I few years back I tested QVector and std::vector side by side, and was living with the impression the two are in the same ballpark of performance, in fact in some cases QVector was edging out.

Until yesterday, when I ran a quick compliance test...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
06 мар 2024, 13:31
Невозможно подавить предупреждение из Transformers/src/transformers/modeling_utils.py.

Последнее сообщение Anonymous « 03 авг 2024, 02:25
Добавлено в форуме Python

Anonymous » 03 авг 2024, 02:25 » в форуме Python

Моя реализация классов AutoModel AutoTokenizer довольно проста:
from transformers import AutoModel, AutoTokenizer
import numpy as np
from rank_bm25 import BM25Okapi
from sklearn.neighbors import NearestNeighbors

class EmbeddingModels:

def...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
03 авг 2024, 02:25
Ожидалось, что все тензоры будут находиться на одном устройстве, но обнаружено как минимум два устройства: cpu и cuda:0,

Последнее сообщение Anonymous « 25 сен 2024, 00:47
Добавлено в форуме Python

Anonymous » 25 сен 2024, 00:47 » в форуме Python

Я работаю над моделью, предназначенной для работы исключительно на графическом процессоре или на центральном процессоре, но поскольку я работаю над кластером HPC, я использую оба варианта.
Я' Я пытался преобразовать код для работы в моей настройке,...

0 Ответы

41 Просмотры

Последнее сообщение Anonymous
25 сен 2024, 00:47

Вернуться в «Python»