Падение производительности модели PyTorch в зависимости от размера пакета тестового набора данных в MPS

Падение производительности модели PyTorch в зависимости от размера пакета тестового набора данных в MPS ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Падение производительности модели PyTorch в зависимости от размера пакета тестового набора данных в MPS

Цитата

Сообщение Anonymous » 23 сен 2024, 04:34

У меня есть модель, использующая LSTM и полносвязный уровень

Код: Выделить всё

Model(
(lstm): LSTM(3, 32, num_layers=3, batch_first=True, dropout=0.7)
(dense): Linear(in_features=32, out_features=2, bias=True)
)

Я обучаю и тестирую свою модель с помощью MPS на чипе Apple M2
Для функции потерь я использую перекрестную энтропийную потерю с вычисленными весами для каждого класса а для оптимизации я использую AdamW, F-Score измеряется классификацией_report из библиотеки sklearn
Проблема в том, что когда размер пакета набора тестовых и обучающих данных равен 64, производительность модели растет, как и ожидалось. Но когда размер пакета тестового набора данных равен 256, производительность сильно упадет и больше не будет расти.
На графике ниже вы можете увидеть производительность размеров пакетов. Розовый график представляет размер пакета тестовых данных 64, синий — размер пакета 256.

F-Score поезда вычисляется на наборе данных поезда с размером пакета 64
Я также всегда устанавливаю для своей модели значение eval() или train( ) режим

Код: Выделить всё

for epoch in range(epochs):

model.train()
print(f'Epoch {epoch}')
__train_loop(model, train_dataloader, loss_function, optimizer, scheduler, verbose, device=device)

model.eval()
train_accuracy, train_f_score = test_model(model, train_dataloader, device=device)

print(f'Train accuracy: {train_accuracy}')
print(f'Train F-Score: {train_f_score}')

accuracy, f_score = test_model(model, test_dataloader, device=device)

цикл обучения:

Код: Выделить всё

for batch_id, (X, y) in enumerate(train_dataloader):

X, y = X.to(device), y.to(device)

optimizer.zero_grad()

y_pred = model(X)
loss = loss_function(y_pred, y)

loss.backward()
optimizer.step()

модель тестирования

Код: Выделить всё

 with torch.no_grad():

for batch_id, (X, y) in enumerate(test_dataloader):
X, y = X.to(device), y.to(device)

y_pred = model(X)
y_pred = torch.argmax(y_pred, dim=1)

y_pred_all.append(y_pred.cpu().numpy())
y_all.append(y.cpu().numpy())
bar.update(batch_id)

y_pred_all = np.hstack(y_pred_all).flatten()
y_all = np.hstack(y_all).flatten()

cr = classification_report(y_all, y_pred_all, output_dict=True)
f_score = cr['macro avg']['f1-score']
accuracy = cr['accuracy']

Я ожидаю, что производительность не изменится кардинально при изменении размера пакета набора данных, влияние размера пакета на выходные данные модели здесь странное, потому что я не использую норму пакета.>

Подробнее здесь: https://stackoverflow.com/questions/790 ... ize-on-mps

1727055295

Anonymous

У меня есть модель, использующая LSTM и полносвязный уровень
[code]Model(
(lstm): LSTM(3, 32, num_layers=3, batch_first=True, dropout=0.7)
(dense): Linear(in_features=32, out_features=2, bias=True)
)
[/code]
Я обучаю и тестирую свою модель с помощью MPS на чипе Apple M2
Для функции потерь я использую перекрестную энтропийную потерю с вычисленными весами для каждого класса а для оптимизации я использую AdamW, F-Score измеряется классификацией_report из библиотеки sklearn
Проблема в том, что когда размер пакета набора тестовых и обучающих данных равен 64, производительность модели растет, как и ожидалось. Но когда размер пакета тестового набора данных равен 256, производительность сильно упадет и больше не будет расти.
На графике ниже вы можете увидеть производительность размеров пакетов. Розовый график представляет размер пакета тестовых данных 64, синий — размер пакета 256. 
[img]https://i.sstatic.net/bm1r73QU.png[/img]

F-Score поезда вычисляется на наборе данных поезда с размером пакета 64
Я также всегда устанавливаю для своей модели значение eval() или train( ) режим
[code]
for epoch in range(epochs):

model.train()
print(f'Epoch {epoch}')
__train_loop(model, train_dataloader, loss_function, optimizer, scheduler, verbose, device=device)

model.eval()
train_accuracy, train_f_score = test_model(model, train_dataloader, device=device)

print(f'Train accuracy: {train_accuracy}')
print(f'Train F-Score: {train_f_score}')

accuracy, f_score = test_model(model, test_dataloader, device=device)

[/code]
цикл обучения:
[code]for batch_id, (X, y) in enumerate(train_dataloader):

X, y = X.to(device), y.to(device)

optimizer.zero_grad()

y_pred = model(X)
loss = loss_function(y_pred, y)

loss.backward()
optimizer.step()

[/code]
модель тестирования
[code] with torch.no_grad():

for batch_id, (X, y) in enumerate(test_dataloader):
X, y = X.to(device), y.to(device)

y_pred = model(X)
y_pred = torch.argmax(y_pred, dim=1)

y_pred_all.append(y_pred.cpu().numpy())
y_all.append(y.cpu().numpy())
bar.update(batch_id)

y_pred_all = np.hstack(y_pred_all).flatten()
y_all = np.hstack(y_all).flatten()

cr = classification_report(y_all, y_pred_all, output_dict=True)
f_score = cr['macro avg']['f1-score']
accuracy = cr['accuracy']

[/code]
Я ожидаю, что производительность не изменится кардинально при изменении размера пакета набора данных, влияние размера пакета на выходные данные модели здесь странное, потому что я не использую норму пакета.> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79012771/pytorch-model-performance-drop-depending-on-test-dataset-batch-size-on-mps[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Классы или объекты внутри основного исходного набора, недоступны для тестового (модульного) исходного набора.

Последнее сообщение Anonymous « 18 янв 2025, 16:50
Добавлено в форуме Android

Anonymous » 18 янв 2025, 16:50 » в форуме Android

Это простой модульный тест, включающий только один объект и соответствующий ему класс модульного теста. Объект находится в файле main/java/com/example/simpleunittest/Validator.kt, а
тестовый класс находится в файле...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
18 янв 2025, 16:50
Почему NVIDIA Megatron загружает итераторы набора данных несколько раз в зависимости от размера модели?

Последнее сообщение Anonymous « 31 окт 2024, 13:01
Добавлено в форуме Python

Anonymous » 31 окт 2024, 13:01 » в форуме Python

Я работаю с кодом NVIDIA Megatron, особенно над разделом загрузки набора данных. Я заметил, что функция build_train_valid_test_data_iterators выполняется несколько раз — в частности, она выполняется len(model) раз, где len(model) соответствует...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
31 окт 2024, 13:01
Модель PyTorch работает на ЦП, несмотря на то, что MPS (Apple Silicon) доступен и обнаружен

Последнее сообщение Anonymous « 31 окт 2024, 15:17
Добавлено в форуме Python

Anonymous » 31 окт 2024, 15:17 » в форуме Python

Я пытаюсь запустить модель HuggingFace Transformers на своем Apple Silicon Mac с помощью MPS (Metal Performance Shaders), но, несмотря на то, что MPS доступен и обнаружен, модель продолжает работать на процессоре, вызывая серьезные проблемы с...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
31 окт 2024, 15:17
Yolo11 с ошибкой C ++ OPS на M3 Mac - Pytorch/MPS -выпуск?

Последнее сообщение Anonymous « 05 фев 2025, 04:35
Добавлено в форуме Python

Anonymous » 05 фев 2025, 04:35 » в форуме Python

У меня есть проблемы, пытаясь заставить Yolov11 работать с депутатами Pytorch на яблоне. Продолжайте получать эту ошибку C ++ OPS и не может выяснить, что случилось. MacBook
Python 3.9
Torch 2.6.0
Touchvision 0.21.0
Torchaudio 2.6.0...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
05 фев 2025, 04:35
Yolo11 с ошибкой C ++ OPS на M3 Mac - Pytorch/MPS -выпуск?

Последнее сообщение Anonymous « 05 фев 2025, 04:35
Добавлено в форуме C++

Anonymous » 05 фев 2025, 04:35 » в форуме C++

У меня есть проблемы, пытаясь заставить Yolov11 работать с депутатами Pytorch на яблоне. Продолжайте получать эту ошибку C ++ OPS и не может выяснить, что случилось. MacBook
Python 3.9
Torch 2.6.0
Touchvision 0.21.0
Torchaudio 2.6.0...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
05 фев 2025, 04:35

Вернуться в «Python»