MPS использует только один графический процессор для обучения

MPS использует только один графический процессор для обучения ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

MPS использует только один графический процессор для обучения

Цитата

Сообщение Anonymous » 31 дек 2024, 03:13

На моем Mac M3 используется только 1/10 ядер графического процессора. Понятия не имею, как использовать их все или хотя бы 8.
Я не думаю, что MPS позволяет использовать более одного ядра графического процессора для обучения. Может ли кто-нибудь мне помочь?
Вот мой код:

Код: Выделить всё

import torch
from transformers import DistilBertForSequenceClassification, DistilBertTokenizer, Trainer, TrainingArguments
from datasets import Dataset, DatasetDict
import pandas as pd
from sklearn.model_selection import train_test_split

# Load the dataset
df = pd.read_csv('jigsaw-toxic-comment-train-processed-seqlen128.csv')

# Drop unnecessary columns
df = df[['comment_text', 'toxic']]

# Split the data into training and validation sets
train_df, val_df = train_test_split(df, test_size=0.2, random_state=42)

# Convert dataframes to Hugging Face Datasets
train_dataset = Dataset.from_pandas(train_df)
val_dataset = Dataset.from_pandas(val_df)
dataset = DatasetDict({'train': train_dataset, 'validation': val_dataset})

# Load tokenizer
tokenizer = DistilBertTokenizer.from_pretrained('distilbert-base-uncased')

def preprocess_function(examples):
return tokenizer(examples['comment_text'], padding='max_length', truncation=True)

# Tokenize the datasets
tokenized_datasets = dataset.map(preprocess_function, batched=True)

# Rename the toxic column to labels for compatibility
tokenized_datasets = tokenized_datasets.rename_column("toxic", "labels")

# Load model
model = DistilBertForSequenceClassification.from_pretrained('distilbert-base-uncased', num_labels=2)

# Move model to device
device = torch.device("mps")
model.to(device)

# Set up training arguments
training_args = TrainingArguments(
output_dir='./results',
evaluation_strategy="epoch",
learning_rate=2e-5,
per_device_train_batch_size=8,
per_device_eval_batch_size=8,
num_train_epochs=3,
weight_decay=0.01,
)

# Initialize Trainer
trainer = Trainer(
model=model,
args=training_args,
train_dataset=tokenized_datasets['train'],
eval_dataset=tokenized_datasets['validation'],
tokenizer=tokenizer,
)

# Train the model
trainer.train()

Я понятия не имею, как решить эту проблему. Может быть, использование MLX поможет?

Подробнее здесь: https://stackoverflow.com/questions/788 ... r-training

1735603997

Anonymous

На моем Mac M3 используется только 1/10 ядер графического процессора. Понятия не имею, как использовать их все или хотя бы 8.
Я не думаю, что MPS позволяет использовать более одного ядра графического процессора для обучения. Может ли кто-нибудь мне помочь?
Вот мой код:
[code]import torch
from transformers import DistilBertForSequenceClassification, DistilBertTokenizer, Trainer, TrainingArguments
from datasets import Dataset, DatasetDict
import pandas as pd
from sklearn.model_selection import train_test_split

# Load the dataset
df = pd.read_csv('jigsaw-toxic-comment-train-processed-seqlen128.csv')

# Drop unnecessary columns
df = df[['comment_text', 'toxic']]

# Split the data into training and validation sets
train_df, val_df = train_test_split(df, test_size=0.2, random_state=42)

# Convert dataframes to Hugging Face Datasets
train_dataset = Dataset.from_pandas(train_df)
val_dataset = Dataset.from_pandas(val_df)
dataset = DatasetDict({'train': train_dataset, 'validation': val_dataset})

# Load tokenizer
tokenizer = DistilBertTokenizer.from_pretrained('distilbert-base-uncased')

def preprocess_function(examples):
return tokenizer(examples['comment_text'], padding='max_length', truncation=True)

# Tokenize the datasets
tokenized_datasets = dataset.map(preprocess_function, batched=True)

# Rename the toxic column to labels for compatibility
tokenized_datasets = tokenized_datasets.rename_column("toxic", "labels")

# Load model
model = DistilBertForSequenceClassification.from_pretrained('distilbert-base-uncased', num_labels=2)

# Move model to device
device = torch.device("mps")
model.to(device)

# Set up training arguments
training_args = TrainingArguments(
output_dir='./results',
evaluation_strategy="epoch",
learning_rate=2e-5,
per_device_train_batch_size=8,
per_device_eval_batch_size=8,
num_train_epochs=3,
weight_decay=0.01,
)

# Initialize Trainer
trainer = Trainer(
model=model,
args=training_args,
train_dataset=tokenized_datasets['train'],
eval_dataset=tokenized_datasets['validation'],
tokenizer=tokenizer,
)

# Train the model
trainer.train()
[/code]
Я понятия не имею, как решить эту проблему. Может быть, использование MLX поможет? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78849006/mps-only-uses-one-gpu-for-training[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Tensorflow не может выбрать графический процессор, хотя графический процессор распознан

Последнее сообщение Anonymous « 08 дек 2023, 14:40
Добавлено в форуме Python

Anonymous » 08 дек 2023, 14:40 » в форуме Python

Я пытался настроить тензорный поток для работы с моим графическим процессором (GTX 1070). Я установил последние версии драйверов NVIDIA 546.29-desktop-win10-win11-64bit-international-dch-whql.exe
Вывод из nvidia-sim...

0 Ответы

97 Просмотры

Последнее сообщение Anonymous
08 дек 2023, 14:40
Tensorflow не может выбрать графический процессор, хотя графический процессор распознан

Последнее сообщение Гость « 08 дек 2023, 15:53
Добавлено в форуме Python

Гость » 08 дек 2023, 15:53 » в форуме Python

Я пытался настроить тензорный поток для работы с моим графическим процессором (GTX 1070). Я установил последние версии драйверов NVIDIA 546.29-desktop-win10-win11-64bit-international-dch-whql.exe
Вывод из nvidia-sim...

0 Ответы

84 Просмотры

Последнее сообщение Гость
08 дек 2023, 15:53
Tensorflow не может выбрать графический процессор, хотя графический процессор распознан

Последнее сообщение Гость « 08 дек 2023, 15:53
Добавлено в форуме Python

Гость » 08 дек 2023, 15:53 » в форуме Python

Я пытался настроить тензорный поток для работы с моим графическим процессором (GTX 1070). Я установил последние версии драйверов NVIDIA 546.29-desktop-win10-win11-64bit-international-dch-whql.exe
Вывод из nvidia-sim...

0 Ответы

93 Просмотры

Последнее сообщение Гость
08 дек 2023, 15:53
Перебрать Dataloader, загруженный на графический процессор (MPS).

Последнее сообщение Гость « 21 сен 2023, 08:49
Добавлено в форуме Python

Гость » 21 сен 2023, 08:49 » в форуме Python

Я работаю с PyTorch над M2 Max.

Я пытаюсь сократить время вычислений с помощью графического процессора.

У меня есть рабочий вариант с GPU:

mnist_test_loader = DataLoader(mnist_test_dataset, patch_size=32, shuffle=False) network.to(device= mps...

0 Ответы

55 Просмотры

Последнее сообщение Гость
21 сен 2023, 08:49
Keras/Tensorflow не использует графический процессор во время обучения

Последнее сообщение Anonymous « 09 ноя 2024, 00:28
Добавлено в форуме Python

Anonymous » 09 ноя 2024, 00:28 » в форуме Python

Я пытаюсь подогнать свою модель к графическому процессору, но тензорный поток не используется для обучения. Самое странное, что тензорный поток обнаруживает мой графический процессор и загружает на него данные. Я использую WSL2 в Windows 10....

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
09 ноя 2024, 00:28

Вернуться в «Python»