Как вычислить значения в каждом узле в GradientBoostingRegressor для обучения scikit-learn? - Цифровое Кемерово

Как вычислить значения в каждом узле в GradientBoostingRegressor для обучения scikit-learn? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как вычислить значения в каждом узле в GradientBoostingRegressor для обучения scikit-learn?

Цитата

Сообщение Anonymous » 15 окт 2024, 18:46

Я пытаюсь вручную вычислить значения, показанные в каждом узле каждого дерева ансамбля, возвращаемого GradientBoostingRegressor.
Итак, вот как я обучаю модель:

Код: Выделить всё

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

from sklearn.datasets import fetch_california_housing
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.tree import plot_tree
from sklearn.model_selection import train_test_split

X, y = fetch_california_housing(return_X_y=True, as_frame=True)
X = X.drop(columns=["Latitude", "Longitude"])

X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.3, random_state=0)

# fit model

gbm = GradientBoostingRegressor(
criterion="squared_error",
n_estimators=2,
max_depth=3,
random_state=3,
)

gbm.fit(X_train, y_train)

Теперь я рисую деревья:

Код: Выделить всё

plt.figure(figsize=(8, 8), dpi=300)

# first tree
plt.subplot(2, 1, 1)
plot_tree(
decision_tree=gbm.estimators_[0][0],
feature_names=X_train.columns.to_list(),
filled=True,  # color the squares
rounded=True,  # round squares
precision = 20,
)
plt.title("First tree")

# second tree
plt.subplot(2, 1, 2)
plot_tree(
decision_tree=gbm.estimators_[1][0],
feature_names=X_train.columns.to_list(),
filled=True,  # color the squares
rounded=True,  # round squares
precision = 20,
)
plt.title("Second tree")

plt.show()

И вот результат:
[img]https://i.sstatic.net /8jc2X.png[/img]

Вопрос в том, как я могу вручную вычислить значение, скажем, первого узла первого, а затем второго дерева?
Я попробовал это, но результат не соответствует значениям на картинке:

Код: Выделить всё

# first node first tree
value = np.mean(y_train - y_train.mean())

# first node second tree
residuals = y_train - 0.1 * gbm.estimators_[0][0].predict(X_train)

np.mean((residuals - np.mean(residuals))

Чего мне не хватает?

Подробнее здесь: https://stackoverflow.com/questions/773 ... stingregre

Реклама

1729007169

Anonymous

Я пытаюсь вручную вычислить значения, показанные в каждом узле каждого дерева ансамбля, возвращаемого GradientBoostingRegressor.
Итак, вот как я обучаю модель:
[code]import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

from sklearn.datasets import fetch_california_housing
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.tree import plot_tree
from sklearn.model_selection import train_test_split

X, y = fetch_california_housing(return_X_y=True, as_frame=True)
X = X.drop(columns=["Latitude", "Longitude"])

X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.3, random_state=0)

# fit model

gbm = GradientBoostingRegressor(
criterion="squared_error",
n_estimators=2,
max_depth=3,
random_state=3,
)

gbm.fit(X_train, y_train)
[/code]
Теперь я рисую деревья:
[code]plt.figure(figsize=(8, 8), dpi=300)

# first tree
plt.subplot(2, 1, 1)
plot_tree(
decision_tree=gbm.estimators_[0][0],
feature_names=X_train.columns.to_list(),
filled=True,  # color the squares
rounded=True,  # round squares
precision = 20,
)
plt.title("First tree")

# second tree
plt.subplot(2, 1, 2)
plot_tree(
decision_tree=gbm.estimators_[1][0],
feature_names=X_train.columns.to_list(),
filled=True,  # color the squares
rounded=True,  # round squares
precision = 20,
)
plt.title("Second tree")

plt.show()
[/code]
И вот результат:
[img]https://i.sstatic.net /8jc2X.png[/img]

Вопрос в том, как я могу вручную вычислить значение, скажем, первого узла первого, а затем второго дерева?
Я попробовал это, но результат не соответствует значениям на картинке:
[code]# first node first tree
value = np.mean(y_train - y_train.mean())

# first node second tree
residuals = y_train - 0.1 * gbm.estimators_[0][0].predict(X_train)

np.mean((residuals - np.mean(residuals))

[/code]
Чего мне не хватает? 

Подробнее здесь: [url]https://stackoverflow.com/questions/77396735/how-to-calculate-the-values-at-each-node-in-a-scikit-learn-gradientboostingregre[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как показать значения потерь во время обучения в scikit-learn?

Последнее сообщение Anonymous « 02 дек 2024, 14:43
Добавлено в форуме Python

Anonymous » 02 дек 2024, 14:43 » в форуме Python

Я хочу проверять значения потерь во время обучения, чтобы иметь возможность наблюдать за потерями на каждой итерации. До сих пор я не нашел простого способа, с помощью которого scikit научился бы предоставлять мне историю значений потерь, и я не...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 14:43
Классификаторы и регрессоры scikit-learn, кэширующие данные обучения?

Последнее сообщение Anonymous « 06 ноя 2024, 16:12
Добавлено в форуме Python

Anonymous » 06 ноя 2024, 16:12 » в форуме Python

У меня около 22 000 строк обучающих данных.
Я использую train_test_split для получения данных обучения и тестирования.
Я запускаю подгонку, а затем получаю некоторое представление о том, насколько хорошо прошла подгонка, используя различные методы...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
06 ноя 2024, 16:12
Классификаторы и регрессоры scikit-learn, кэширующие данные обучения?

Последнее сообщение Anonymous « 07 ноя 2024, 01:55
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 01:55 » в форуме Python

У меня около 22 000 строк обучающих данных.
Я использую train_test_split для получения данных обучения и тестирования.
Я запускаю подгонку, а затем получаю некоторое представление о том, насколько хорошо прошла подгонка, используя различные методы...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 01:55
Как создать модель машинного обучения и регрессии линии для конкретного устройства с Python и Scikit-Learn

Последнее сообщение Anonymous « 04 фев 2025, 20:46
Добавлено в форуме Python

Anonymous » 04 фев 2025, 20:46 » в форуме Python

У меня есть следующая схема источника данных:
Введите описание изображения здесь
Я кодирует 'Дату' Столбец на три отдельных столбца:
Год, месяц, дата.
Мои будущие -
device_id; enuration_energy; Год; месяц; день
Введите описание изображения здесь...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
04 фев 2025, 20:46
Каковы лучшие бесплатные ресурсы или учебные пособия, чтобы выучить Scikit-Learn для начинающих машинного обучения? [зак

Последнее сообщение Anonymous « 16 июн 2025, 20:27
Добавлено в форуме Python

Anonymous » 16 июн 2025, 20:27 » в форуме Python

В настоящее время я нахожусь в середине своего путешествия по машинному обучению, и я освещал основы, такие как Python, Numpy, Pandas и Matplotlib. Теперь я хочу глубже погрузиться в Scikit-Learn-библиотека, которая широко используется для...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
16 июн 2025, 20:27

Вернуться в «Python»

Programmiererforum