Statsmodels OLS дает результаты, отличные от матричной алгебры

Statsmodels OLS дает результаты, отличные от матричной алгебры ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Statsmodels OLS дает результаты, отличные от матричной алгебры

Цитата

Сообщение Anonymous » 25 июн 2024, 10:08

Мне нужно выполнить регрессию OLS на Python с использованием numpy и матричной алгебры.
Я использовал следующий код:

Код: Выделить всё

import numpy as np
coeff = np.linalg.inv(X.T@X)@X.T@y

где X — матрица независимых переменных, а y — вектор зависимых переменных.
Я сравнил эти результаты с оценками, полученными с помощью статистических моделей OLS, следующим образом:

Код: Выделить всё

import numpy as np
import statsmodels.api as sm
model = sm.OLS(y, X)
results = model.fit()
coeff = results.params

По какой-то причине я получаю разные результаты, и мне интересно, почему. Я также пытался написать форму матричной алгебры по-другому, но, похоже, она всегда дает другие результаты, чем статистические модели OLS.
Вот пример, который приводит к другим результатам:

Код: Выделить всё

    data = np.array([
[1, 2, 3, 14],
[2, 4, 5, 25],
[3, 6, 7, 36],
[4, 8, 9, 47],
[5, 10, 11, 58]
])

# Independent variables (X) - First three columns
X = data[:, :-1]

# Dependent variable (Y) - Last column
y = data[:, -1]

statsmodels OLS создает вектор коэффициентов, в то время как форма матричной алгебры приводит к ошибке, поскольку матрица X.T@X не является обратимой. Фактический набор данных, для которого мне нужен подход матричной алгебры, значительно больше, поэтому я предпочел включить этот меньший пример. В моем конкретном случае матрица X.T@X является обратимой, но коэффициенты значительно отличаются от коэффициентов OLS статистических моделей. Я предполагаю, что это зависит от обратного X.T@X и другой процедуры оценки коэффициентов между двумя подходами, отсюда и мой вопрос.

Подробнее здесь: https://stackoverflow.com/questions/766 ... ix-algebra

1719299330

Anonymous

Мне нужно выполнить регрессию OLS на Python с использованием numpy и матричной алгебры.
Я использовал следующий код:
[code]import numpy as np
coeff = np.linalg.inv(X.T@X)@X.T@y
[/code]
где X — матрица независимых переменных, а y — вектор зависимых переменных.
Я сравнил эти результаты с оценками, полученными с помощью статистических моделей OLS, следующим образом:
[code]import numpy as np
import statsmodels.api as sm
model = sm.OLS(y, X)
results = model.fit()
coeff = results.params
[/code]
По какой-то причине я получаю разные результаты, и мне интересно, почему. Я также пытался написать форму матричной алгебры по-другому, но, похоже, она всегда дает другие результаты, чем статистические модели OLS.
Вот пример, который приводит к другим результатам:
[code]    data = np.array([
[1, 2, 3, 14],
[2, 4, 5, 25],
[3, 6, 7, 36],
[4, 8, 9, 47],
[5, 10, 11, 58]
])

# Independent variables (X) - First three columns
X = data[:, :-1]

# Dependent variable (Y) - Last column
y = data[:, -1]
[/code]
statsmodels OLS создает вектор коэффициентов, в то время как форма матричной алгебры приводит к ошибке, поскольку матрица X.T@X не является обратимой. Фактический набор данных, для которого мне нужен подход матричной алгебры, значительно больше, поэтому я предпочел включить этот меньший пример. В моем конкретном случае матрица X.T@X является обратимой, но коэффициенты значительно отличаются от коэффициентов OLS статистических моделей. Я предполагаю, что это зависит от обратного X.T@X и другой процедуры оценки коэффициентов между двумя подходами, отсюда и мой вопрос. 

Подробнее здесь: [url]https://stackoverflow.com/questions/76686361/statsmodels-ols-yields-different-results-than-matrix-algebra[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ошибка с использованием StatsModels OLS: возвращение значений NAN

Последнее сообщение Anonymous « 08 июл 2025, 22:04
Добавлено в форуме Python

Anonymous » 08 июл 2025, 22:04 » в форуме Python

У меня есть набор данных, например:

Growth NHSPSTY% Index USURTOT Index GLPFTOCI Index CPTICHNG Index NAPMPMI Index RSTAXYOY Index SAARTOTL Index USASHVTK Index CONCCONF Index LEI TOTL Index SPX Index TOT_DEBT_TO_TOT_EQY BDIY Index cry index CO1...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
08 июл 2025, 22:04
Почему переменная глобального буфера дает результаты, отличные от переменной локального буфера при использовании SPI?

Последнее сообщение Anonymous « 01 янв 2024, 03:12
Добавлено в форуме C++

Anonymous » 01 янв 2024, 03:12 » в форуме C++

Хорошо, давний разработчик, но с языками более высокого порядка, такими как C# и Swift. Работаю на родном C++ для аппаратного проекта, над которым работаю, и использую Arduino для его прототипирования. Однако это меня поставило в тупик.

У меня...

0 Ответы

102 Просмотры

Последнее сообщение Anonymous
01 янв 2024, 03:12
Расчет StochRSI в Python дает результаты, отличные от диаграммы Kraken

Последнее сообщение Anonymous « 12 окт 2024, 21:05
Добавлено в форуме Python

Anonymous » 12 окт 2024, 21:05 » в форуме Python

Я пытаюсь рассчитать индикатор StochRSI для анализа рынка криптовалют с целью интеграции его в торгового бота для принятия торговых решений. Я получаю рыночные данные от Kraken, используя библиотеку ccxt.
Однако значения StochRSI, которые я...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
12 окт 2024, 21:05
Расчет StochRSI в Python дает результаты, отличные от диаграммы Kraken

Последнее сообщение Anonymous « 13 окт 2024, 12:24
Добавлено в форуме Python

Anonymous » 13 окт 2024, 12:24 » в форуме Python

Я пытаюсь рассчитать индикатор StochRSI для анализа рынка криптовалют с целью интеграции его в торгового бота для принятия торговых решений. Я получаю рыночные данные от Kraken, используя библиотеку ccxt.
Однако значения StochRSI, которые я...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
13 окт 2024, 12:24
Расчет StochRSI в Python дает результаты, отличные от диаграммы Kraken

Последнее сообщение Anonymous « 27 янв 2025, 03:54
Добавлено в форуме Python

Anonymous » 27 янв 2025, 03:54 » в форуме Python

Я пытаюсь рассчитать индикатор StochRSI для анализа рынка криптовалют с целью интеграции его в торгового бота для принятия торговых решений. Я получаю рыночные данные от Kraken, используя библиотеку ccxt.
Однако значения StochRSI, которые я...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
27 янв 2025, 03:54

Вернуться в «Python»