Неожиданное поведение коэффициентов sklearn Lasso для небольших значений альфа

Неожиданное поведение коэффициентов sklearn Lasso для небольших значений альфа ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Неожиданное поведение коэффициентов sklearn Lasso для небольших значений альфа

Цитата

Сообщение Anonymous » 29 июн 2024, 18:43

Вот базовый код, создающий проблему регрессии.

Код: Выделить всё

import numpy as np
import pandas as pd
from sklearn.linear_model import Lasso, LinearRegression

n = 100
np.random.seed(42)
X = np.random.normal(size=n)
eps = np.random.normal(size=n)

b_0, b_1, b_2, b_3 = 0.5, 2.8, 6.7, 3.4
Y = b_0 + b_1 * X + b_2 * (X ** 2) + b_3 * (X ** 3) + eps

n_cols = 10

df_X = pd.DataFrame(columns=[f'X ^ {i}' for i in range(1, n_cols + 1)])
for i in range(1, n_cols + 1):
df_X[f'X ^ {i}'] = X ** i

Я смотрел, как Lasso сжимает коэффициенты, и заметил что-то странное. Значения коэффициентов для переменных X, возведенных в степень больше 3 (переменные, избыточные для реальной задачи, но увеличивающие дисперсию модели), имеют коэффициенты почти 0 для альфа/лямбда, равных 0. Я проверил, каковы коэффициенты для OLS и они очень ненулевые:

бета OLS
бета Lasso

const
0.3
0,3

X^1
2,22,5

X^2
5,8
6,9

X^3
5.3
3.7

X^4
3,0
-0,03

X^5
-2,0
-0,14

X^ 6
-2,4
0

< td>X^7
0.8
0

X^8
0.7
0

X^9
-0,1
0

X^10
-0,07
0

Теоретически Lasso с альфа/лямбда = 0 должно давать те же результаты, что и OLS. Я обнаружил, что здесь был задан аналогичный вопрос, и я понимаю, что, как указано в документации по Lasso:

Когда альфа = 0, Цель эквивалентна обычному методу наименьших квадратов, решаемому с помощью объекта LinearReгрессия. По числовым причинам использование альфа = 0 с объектом «Лассо» не рекомендуется. Вместо этого вам следует использовать объект LinearReгрессия.

Хорошо, конечно, это имеет смысл, числовые проблемы. Но почему результаты такие разные, даже если альфа равна не нулю, а например 0,00001, или 0,001, или 0,1?
Если вы посмотрите на график коэффициентов сжатия, которые я вы заметите, что начальные высокие значения коэффициентов для X^4/5/6/7/8 полностью опущены в том, что создает Lasso. Или, может быть, они начинают проявляться на уровне lasso~=0,5, но тогда же они начинают сжиматься.
[img]https: //i.sstatic.net/26FwAEhM.png[/img]

Код создания графика:

Код: Выделить всё

lambdas = np.concatenate((np.linspace(0, 1 - 1e-8, 1000), np.linspace(1, 200, 1000)))
coefs_path = []
for l in lambdas:
model = Lasso(alpha=l)
model.fit(df_X, Y)
coefs_path.append(model.coef_)
coefs_path = np.array(coefs_path)

for i_var in range(df_X.shape[1]):
plt.plot(lambdas, coefs_path[:, i_var], label=f'$X^{{{i_var+1}}}$')
plt.title('Shrinking coefficients')
plt.xlabel('$\lambda$')
plt.xlim(left=-1, right=10)

# I have a different part of code where I use sklearns' LassoCV, but that is irrelevant here.
lasso_cv_alpha_ = 0.28
plt.axvline(lasso_cv_alpha_, lw=2, linestyle='--', color='#49eb34', label=f'Best coefficients ($\lambda$ = {lasso_cv_alpha_:.3f})')

plt.legend();

Это ожидаемое поведение? Потому что это не так.
Редактировать на основе комментариев Хорди Пастора:
Действительно, изменение параметров модели Лассо на Lasso(alpha=l, max_iter=int(1e6), tol=1e-16) дает ненулевые коэффициенты для X^4/5/6/7/8 /9/10 переменных. Они все еще далеки от OLS, как представлено ниже.

бета-версии OLS
бета-версии Lasso (tol и max_iter)

const< /td>
0,3
0,3

X ^1
2.2
2.7

< td>X^2
5,8
6,0

X^3
5,3
2,8

X^4
3.0
2.1

X^5
-2,0
1,0

X^6
-2,4
-1,3

X^7
0,8
-0,5

X^8
0.7
0,2

X^9
-0,1
0.07

X^10
-0.07
0

Вот обновленный график коэффициентов сжатия с измененными параметрами модели. Я изменил диапазон по оси X, чтобы лучше видеть небольшие значения альфа/лямбда.

И снова результаты показались мне странными. Коэффициенты начинаются со значений, указанных выше в столбце бета-лассо, но почти сразу падают до нуля. Чтобы внести ясность, параметры max_iter и tol были установлены для всех прогонов модели.
Честно говоря, сейчас для меня это еще более странно.

Подробнее здесь: https://stackoverflow.com/questions/786 ... pha-values

1719675822

Anonymous

Вот базовый код, создающий проблему регрессии.
[code]import numpy as np
import pandas as pd
from sklearn.linear_model import Lasso, LinearRegression

n = 100
np.random.seed(42)
X = np.random.normal(size=n)
eps = np.random.normal(size=n)

b_0, b_1, b_2, b_3 = 0.5, 2.8, 6.7, 3.4
Y = b_0 + b_1 * X + b_2 * (X ** 2) + b_3 * (X ** 3) + eps

n_cols = 10

df_X = pd.DataFrame(columns=[f'X ^ {i}' for i in range(1, n_cols + 1)])
for i in range(1, n_cols + 1):
df_X[f'X ^ {i}'] = X ** i

[/code]
Я смотрел, как Lasso сжимает коэффициенты, и заметил что-то странное. Значения коэффициентов для переменных X, возведенных в степень больше 3 (переменные, избыточные для реальной задачи, но увеличивающие дисперсию модели), имеют коэффициенты почти 0 для альфа/лямбда, равных 0. Я проверил, каковы коэффициенты для OLS и они очень ненулевые:




бета OLS
бета Lasso




const
0.3
0,3


X^1
2,22,5


X^2
5,8
6,9


X^3
 5.3
3.7


X^4
3,0
-0,03


X^5
-2,0
-0,14


X^ 6
-2,4
0


< td>X^7
0.8
0


X^8
0.7
0


X^9
-0,1
0


X^10
-0,07
0



Теоретически Lasso с альфа/лямбда = 0 должно давать те же результаты, что и OLS. Я обнаружил, что здесь был задан аналогичный вопрос, и я понимаю, что, как указано в документации по Lasso:

Когда альфа = 0, Цель эквивалентна обычному методу наименьших квадратов, решаемому с помощью объекта LinearReгрессия. По числовым причинам использование альфа = 0 с объектом «Лассо» не рекомендуется. Вместо этого вам следует использовать объект LinearReгрессия.

Хорошо, конечно, это имеет смысл, числовые проблемы. Но почему результаты такие разные, даже если альфа равна не нулю, а например 0,00001, или 0,001, или 0,1?
Если вы посмотрите на график коэффициентов сжатия, которые я вы заметите, что начальные высокие значения коэффициентов для X^4/5/6/7/8 полностью опущены в том, что создает Lasso. Или, может быть, они начинают проявляться на уровне lasso~=0,5, но тогда же они начинают сжиматься.
[img]https: //i.sstatic.net/26FwAEhM.png[/img]

Код создания графика:
[code]lambdas = np.concatenate((np.linspace(0, 1 - 1e-8, 1000), np.linspace(1, 200, 1000)))
coefs_path = []
for l in lambdas:
model = Lasso(alpha=l)
model.fit(df_X, Y)
coefs_path.append(model.coef_)
coefs_path = np.array(coefs_path)

for i_var in range(df_X.shape[1]):
plt.plot(lambdas, coefs_path[:, i_var], label=f'$X^{{{i_var+1}}}$')
plt.title('Shrinking coefficients')
plt.xlabel('$\lambda$')
plt.xlim(left=-1, right=10)

# I have a different part of code where I use sklearns' LassoCV, but that is irrelevant here.
lasso_cv_alpha_ = 0.28
plt.axvline(lasso_cv_alpha_, lw=2, linestyle='--', color='#49eb34', label=f'Best coefficients ($\lambda$ = {lasso_cv_alpha_:.3f})')

plt.legend();
[/code]
Это ожидаемое поведение? Потому что это не так.
[b]Редактировать на основе комментариев Хорди Пастора:[/b]
Действительно, изменение параметров модели Лассо на Lasso(alpha=l, max_iter=int(1e6), tol=1e-16) дает ненулевые коэффициенты для X^4/5/6/7/8 /9/10 переменных.  Они все еще далеки от OLS, как представлено ниже.




бета-версии OLS
бета-версии Lasso (tol и max_iter)




const< /td>
0,3
0,3


X ^1
2.2
2.7


< td>X^2
5,8
6,0


X^3
5,3
2,8


X^4
3.0
2.1


X^5
-2,0
1,0


X^6
-2,4
-1,3


X^7
0,8
-0,5


X^8
0.7
 0,2


X^9
-0,1
0.07


X^10
-0.07
0



Вот обновленный график коэффициентов сжатия с измененными параметрами модели. Я изменил диапазон по оси X, чтобы лучше видеть небольшие значения альфа/лямбда.
[img]https://i.sstatic.net/JfzV0pY2 .png[/img]
И снова результаты показались мне странными. Коэффициенты начинаются со значений, указанных выше в столбце [b]бета-лассо[/b], но почти сразу падают до нуля. Чтобы внести ясность, параметры max_iter и tol были установлены для всех прогонов модели.
Честно говоря, сейчас для меня это еще более странно. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78676517/unexpected-coefficient-behaviour-of-sklearn-lasso-for-small-alpha-values[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Регрессия Sklearn Lasso на порядок хуже, чем регрессия хребта?

Последнее сообщение Anonymous « 10 мар 2025, 01:25
Добавлено в форуме Python

Anonymous » 10 мар 2025, 01:25 » в форуме Python

В настоящее время я реализовал регрессию Ridge и Lasso с использованием модуля sklearn.linear_model .

Однако регрессия Лассо, кажется, делает на 3 порядка хуже в одном и том же наборе данных! Вот мой код:

def ridge_regression(X_train, Y_train,...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
10 мар 2025, 01:25
Регрессия Sklearn Lasso на порядок хуже, чем регрессия хребта?

Последнее сообщение Anonymous « 10 мар 2025, 05:03
Добавлено в форуме Python

Anonymous » 10 мар 2025, 05:03 » в форуме Python

В настоящее время я внедрил регрессию хребта и лассо, используя модуль sklearn.linear_model .
Однако регрессия Lasso, кажется, делает на 3 порядка хуже в одном и том же наборе данных! Вот мой код:
def ridge_regression(X_train, Y_train, X_test,...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
10 мар 2025, 05:03
Расчет коэффициентов, алгоритм распределения коэффициентов

Последнее сообщение Anonymous « 23 май 2024, 00:28
Добавлено в форуме Php

Anonymous » 23 май 2024, 00:28 » в форуме Php

Я плохо говорю по-английски, заранее прошу прощения
Часть 1. Что и как работает
Сначала расскажу подскажите в чем заключается задача, нужно создать некий алгоритм, на входе которого будет массив с предметами, имеющими цену( 'cost' => 123 ), а также...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
23 май 2024, 00:28
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 02 дек 2024, 01:49
Добавлено в форуме Python

Anonymous » 02 дек 2024, 01:49 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

51 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 01:49
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 02 дек 2024, 13:06
Добавлено в форуме Python

Anonymous » 02 дек 2024, 13:06 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

54 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 13:06

Вернуться в «Python»