XGBOOST GPU Версия не превосходит процессор в небольшом наборе данных, несмотря на настройку параметров - необходимы пре

XGBOOST GPU Версия не превосходит процессор в небольшом наборе данных, несмотря на настройку параметров - необходимы пре ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

XGBOOST GPU Версия не превосходит процессор в небольшом наборе данных, несмотря на настройку параметров - необходимы пре

Цитата

Сообщение Anonymous » 02 май 2025, 19:17

В настоящее время я работаю над параллельным и распределенным вычислительным проектом, где я сравниваю производительность XGBOOST, работающего на процессоре против графического процессора. Цель состоит в том, чтобы продемонстрировать, как ускорение графического процессора может улучшить время обучения, особенно при использовании соответствующих параметров. Фактически, в большинстве случаев версия процессора также работает или даже быстрее, чем версия GPU. < /P>
@timer_decorator
def train_xgboost_cpu(self, X_train, y_train):
"""
Train XGBoost Classifier on CPU with parameters that perform less efficiently
"""
print("Training XGBoost Classifier on CPU...")
xgb_clf = xgb.XGBClassifier(
n_estimators=1500,
max_depth=15,
learning_rate=0.01,
subsample=0.9,
colsample_bytree=0.9,
objective='binary:logistic',
tree_method='hist',
n_jobs=self.n_jobs,
random_state=42,
max_bin=256,
grow_policy='depthwise'
verbosity=1,
use_label_encoder=False
)

print(f"Training XGBoost CPU on data shape: {X_train.shape}")
xgb_clf.fit(X_train, y_train)

return xgb_clf

@timer_decorator
def train_xgboost_gpu(self, X_train, y_train):
"""
Train XGBoost Classifier with GPU acceleration optimized for performance
"""
if not XGB_GPU_AVAILABLE:
print("XGBoost GPU support not available, falling back to CPU")
return self.train_xgboost_cpu(X_train, y_train)

# Initialize and train the model with GPU-optimized parameters
print("Training XGBoost Classifier on GPU...")
try:
xgb_clf = xgb.XGBClassifier(
n_estimators=1500,
max_depth=15,
learning_rate=0.01,
subsample=0.9,
colsample_bytree=0.9,
objective='binary:logistic',
tree_method='gpu_hist',
predictor='gpu_predictor',
grow_policy='depthwise',
gpu_id=0,
random_state=42,
max_bin=256,
verbosity=1,
use_label_encoder=False
)
xgb_clf.fit(X_train, y_train)
return xgb_clf
except Exception as e:
print(f"XGBoost GPU training failed: {e}")
print("Falling back to CPU training")
return self.train_xgboost_cpu(X_train, y_train)

< /code>
Подробнее:
Размер набора данных: ~ 41 000 строк (малый /средний).
Цель: сравнивать процессору с GPU. Придется работать с этим набором данных независимо.

Подробнее здесь: https://stackoverflow.com/questions/796 ... ameter-tun

1746202643

Anonymous

 В настоящее время я работаю над параллельным и распределенным вычислительным проектом, где я сравниваю производительность XGBOOST, работающего на процессоре против графического процессора. Цель состоит в том, чтобы продемонстрировать, как ускорение графического процессора может улучшить время обучения, особенно при использовании соответствующих параметров. Фактически, в большинстве случаев версия процессора также работает или даже быстрее, чем версия GPU. < /P>
    @timer_decorator
def train_xgboost_cpu(self, X_train, y_train):
"""
Train XGBoost Classifier on CPU with parameters that perform less efficiently
"""
print("Training XGBoost Classifier on CPU...")
xgb_clf = xgb.XGBClassifier(
n_estimators=1500,
max_depth=15,
learning_rate=0.01,
subsample=0.9,
colsample_bytree=0.9,
objective='binary:logistic',
tree_method='hist',
n_jobs=self.n_jobs,
random_state=42,
max_bin=256,
grow_policy='depthwise'
verbosity=1,
use_label_encoder=False
)

print(f"Training XGBoost CPU on data shape: {X_train.shape}")
xgb_clf.fit(X_train, y_train)

return xgb_clf

@timer_decorator
def train_xgboost_gpu(self, X_train, y_train):
"""
Train XGBoost Classifier with GPU acceleration optimized for performance
"""
if not XGB_GPU_AVAILABLE:
print("XGBoost GPU support not available, falling back to CPU")
return self.train_xgboost_cpu(X_train, y_train)

# Initialize and train the model with GPU-optimized parameters
print("Training XGBoost Classifier on GPU...")
try:
xgb_clf = xgb.XGBClassifier(
n_estimators=1500,
max_depth=15,
learning_rate=0.01,
subsample=0.9,
colsample_bytree=0.9,
objective='binary:logistic',
tree_method='gpu_hist',
predictor='gpu_predictor',
grow_policy='depthwise',
gpu_id=0,
random_state=42,
max_bin=256,
verbosity=1,
use_label_encoder=False
)
xgb_clf.fit(X_train, y_train)
return xgb_clf
except Exception as e:
print(f"XGBoost GPU training failed: {e}")
print("Falling back to CPU training")
return self.train_xgboost_cpu(X_train, y_train)

< /code>
Подробнее:
Размер набора данных: ~ 41 000 строк (малый /средний).
Цель: сравнивать процессору с GPU. Придется работать с этим набором данных независимо.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79603748/xgboost-gpu-version-not-outperforming-cpu-on-small-dataset-despite-parameter-tun[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

XGBOOST GPU Версия не превосходит процессор в небольшом наборе данных, несмотря на настройку параметров - необходимы пре

Последнее сообщение Anonymous « 02 май 2025, 22:19
Добавлено в форуме Python

Anonymous » 02 май 2025, 22:19 » в форуме Python

В настоящее время я работаю над параллельным и распределенным вычислительным проектом, где я сравниваю производительность XGBOOST, работающего на процессоре против графического процессора. Цель состоит в том, чтобы продемонстрировать, как ускорение...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
02 май 2025, 22:19
Насколько LM (сотни миллионов параметров) превосходит LLM (миллиарды параметров) в задаче двоичной классификации? такое

Последнее сообщение Anonymous « 30 июн 2024, 17:07
Добавлено в форуме Python

Anonymous » 30 июн 2024, 17:07 » в форуме Python

Предисловие
Я пытаюсь доработать модель на основе трансформатора (LM и LLM). LM, который я использовал, — DEBERTA, а LLM — LLaMA 3. Задача — определить, содержит ли текст снисходительный язык (бинарная классификация).
Я использую...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
30 июн 2024, 17:07
ML.Net: System.OutOfMemoryException: «Выброшено исключение типа System.OutOfMemoryException». на небольшом наборе данных

Последнее сообщение Гость « 01 мар 2024, 09:56
Добавлено в форуме C#

Гость » 01 мар 2024, 09:56 » в форуме C#

У меня есть CSV размером 60 МБ с 700 000 строк, по моему мнению, это не так уж и много. Моя машина имеет 32 ГБ памяти и не использует даже 20% памяти, когда я смотрю производительность. Я пытался собрать выпускную сборку на 64-битной версии, но все...

0 Ответы

54 Просмотры

Последнее сообщение Гость
01 мар 2024, 09:56
GPU в GPU прямой передачу данных с помощью ConnectX и RDMA

Последнее сообщение Anonymous « 16 май 2025, 22:23
Добавлено в форуме Python

Anonymous » 16 май 2025, 22:23 » в форуме Python

Мы пытаемся подключить два графических процессора, расположенных на двух серверах через RDMA и Infinibands. Графильные процессоры-NVIDIA RTX 6000 ADA, а Infinbands-NVIDIA CONNECTX-6.
Конфигурация сервера
Наш сервер имеет конфигурацию изображения,...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
16 май 2025, 22:23
Как тренировать XGBOOST на большом наборе данных и улучшить обнаружение мошенничества?

Последнее сообщение Anonymous « 10 фев 2025, 14:56
Добавлено в форуме Python

Anonymous » 10 фев 2025, 14:56 » в форуме Python

Я только начинаю с ML, поэтому я буду признателен за любым советом. Данные сильно несбалансированы (~ 96% нормального и ~ 4% мошенничества).
Первая проблема - потребление памяти
файл обучения составляет 32 ГБ, но даже при чтении всего 1 миллиона...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
10 фев 2025, 14:56

Вернуться в «Python»