Как мы можем рассчитать среднюю абсолютную ошибку (MAE) для регрессии Пуассона с нулевым завышением и отрицательной бино

Как мы можем рассчитать среднюю абсолютную ошибку (MAE) для регрессии Пуассона с нулевым завышением и отрицательной бино ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как мы можем рассчитать среднюю абсолютную ошибку (MAE) для регрессии Пуассона с нулевым завышением и отрицательной бино

Цитата

Сообщение Anonymous » 31 окт 2024, 04:16

Я пытаюсь использовать Python для расчета средней абсолютной ошибки (MAE) при выполнении регрессии Пуассона с нулевым завышением и отрицательной биномиальной регрессии с нулевым увеличением.
Я разделил данные на данные обучения и данные тестирования. Я использую код ниже, но он не работает:

Код: Выделить всё

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.svm import SVR
from sklearn.neighbors import KNeighborsRegressor
from sklearn.metrics import mean_absolute_error
from sklearn.preprocessing import StandardScaler
import statsmodels.api as sm
import statsmodels.formula.api as smf
import tensorflow as tf
df = pd.read_excel('....', sheet_name='Sheet1')
print(df.head())
X = df[['a', 'b', 'c', 'd', 'e', 'f']]
y = df['g']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

from statsmodels.discrete.count_model import ZeroInflatedPoisson
y_zip = y_train.values

y_zip_test = y_test.values

X_count =  X_train.values # Predictors for count part
X_zero = X_train.values  # Predictors for zero-inflation part

X_count_test = X_test.values
X_zero_test = X_test.values

# Add a constant for the intercept
X_count = sm.add_constant(X_count)
X_zero = sm.add_constant(X_zero)

# Fit the ZIP model
zip_model = ZeroInflatedPoisson(endog=y_zip, exog=X_count, exog_infl=X_zero, inflation='logit')
zip_model_fit = zip_model.fit()
print(zip_model_fit.summary())

# Make predictions
y_pred = zip_model_fit.predict(X_count_test)

# Calculate MAE
mae = np.mean(np.abs(y_zip_test - y_pred))
print(f'Mean Absolute Error: {mae}')

Результаты ниже

Код: Выделить всё

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
Cell In[3], line 33
29 print(zip_model_fit.summary())
32 # Make predictions
---> 33 y_pred = zip_model_fit.predict(X_count_test)
35 # Calculate MAE của test
36 mae = np.mean(np.abs(y_zip_test - y_pred))

File ~\anaconda3\envs\tf\lib\site-packages\statsmodels\base\model.py:1174, in Results.predict(self, exog, transform, *args, **kwargs)
1127 """
1128 Call self.model.predict with self.params as the first argument.
1129
(...)
1169 returned prediction.
1170 """
1171 exog, exog_index = self._transform_predict_exog(exog,
1172                                                 transform=transform)
-> 1174 predict_results = self.model.predict(self.params, exog, *args,
1175                                      **kwargs)
1177 if exog_index is not None and not hasattr(predict_results,
1178                                           'predicted_values'):
1179     if predict_results.ndim == 1:

File ~\anaconda3\envs\tf\lib\site-packages\statsmodels\discrete\count_model.py:453, in GenericZeroInflated.predict(self, params, exog, exog_infl, exposure, offset, which, y_values)
449 params_main = params[self.k_inflate:]
451 prob_main = 1 - self.model_infl.predict(params_infl, exog_infl)
--> 453 lin_pred = np.dot(exog, params_main[:self.exog.shape[1]]) + exposure + offset
455 # Refactor: This is pretty hacky,
456 # there should be an appropriate predict method in model_main
457 # this is just prob(y=0 | model_main)
458 tmp_exog = self.model_main.exog

ValueError: shapes (21,6) and (7,) not aligned: 6 (dim 1) != 7 (dim 0)

Ошибку можно устранить с помощью dataframe.
y_train, X_train = dmatrices(expr, recreated_train_data, return_type='dataframe')
Однако я встречаюсь с проблемами, которые модель не сходится с информацией ниже:

Код: Выделить всё

C:\Users\Admin\anaconda3\envs\tf\lib\site-packages\scipy\optimize\_optimize.py:1291: OptimizeWarning: Maximum number of iterations has been exceeded.
res = _minimize_bfgs(f, x0, args, fprime, callback=callback, **opts)
C:\Users\Admin\anaconda3\envs\tf\lib\site-packages\statsmodels\base\model.py:607: ConvergenceWarning: Maximum Likelihood optimization failed to converge. Check mle_retvals
warnings.warn("Maximum Likelihood optimization failed to "

Как устранить эту ошибку?

Подробнее здесь: https://stackoverflow.com/questions/791 ... on-regress

1730337386

Anonymous

Я пытаюсь использовать Python для расчета средней абсолютной ошибки (MAE) при выполнении регрессии Пуассона с нулевым завышением и отрицательной биномиальной регрессии с нулевым увеличением.
Я разделил данные на данные обучения и данные тестирования. Я использую код ниже, но он не работает:
[code]import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.svm import SVR
from sklearn.neighbors import KNeighborsRegressor
from sklearn.metrics import mean_absolute_error
from sklearn.preprocessing import StandardScaler
import statsmodels.api as sm
import statsmodels.formula.api as smf
import tensorflow as tf
df = pd.read_excel('....', sheet_name='Sheet1')
print(df.head())
X = df[['a', 'b', 'c', 'd', 'e', 'f']]
y = df['g']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

from statsmodels.discrete.count_model import ZeroInflatedPoisson
y_zip = y_train.values

y_zip_test = y_test.values

X_count =  X_train.values # Predictors for count part
X_zero = X_train.values  # Predictors for zero-inflation part

X_count_test = X_test.values
X_zero_test = X_test.values

# Add a constant for the intercept
X_count = sm.add_constant(X_count)
X_zero = sm.add_constant(X_zero)

# Fit the ZIP model
zip_model = ZeroInflatedPoisson(endog=y_zip, exog=X_count, exog_infl=X_zero, inflation='logit')
zip_model_fit = zip_model.fit()
print(zip_model_fit.summary())

# Make predictions
y_pred = zip_model_fit.predict(X_count_test)

# Calculate MAE
mae = np.mean(np.abs(y_zip_test - y_pred))
print(f'Mean Absolute Error: {mae}')
[/code]
Результаты ниже
[code]---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
Cell In[3], line 33
29 print(zip_model_fit.summary())
32 # Make predictions
---> 33 y_pred = zip_model_fit.predict(X_count_test)
35 # Calculate MAE của test
36 mae = np.mean(np.abs(y_zip_test - y_pred))

File ~\anaconda3\envs\tf\lib\site-packages\statsmodels\base\model.py:1174, in Results.predict(self, exog, transform, *args, **kwargs)
1127 """
1128 Call self.model.predict with self.params as the first argument.
1129
(...)
1169 returned prediction.
1170 """
1171 exog, exog_index = self._transform_predict_exog(exog,
1172                                                 transform=transform)
-> 1174 predict_results = self.model.predict(self.params, exog, *args,
1175                                      **kwargs)
1177 if exog_index is not None and not hasattr(predict_results,
1178                                           'predicted_values'):
1179     if predict_results.ndim == 1:

File ~\anaconda3\envs\tf\lib\site-packages\statsmodels\discrete\count_model.py:453, in GenericZeroInflated.predict(self, params, exog, exog_infl, exposure, offset, which, y_values)
449 params_main = params[self.k_inflate:]
451 prob_main = 1 - self.model_infl.predict(params_infl, exog_infl)
--> 453 lin_pred = np.dot(exog, params_main[:self.exog.shape[1]]) + exposure + offset
455 # Refactor: This is pretty hacky,
456 # there should be an appropriate predict method in model_main
457 # this is just prob(y=0 | model_main)
458 tmp_exog = self.model_main.exog

ValueError: shapes (21,6) and (7,) not aligned: 6 (dim 1) != 7 (dim 0)
[/code]
Ошибку можно устранить с помощью dataframe.
y_train, X_train = dmatrices(expr, recreated_train_data, return_type='dataframe')
Однако я встречаюсь с проблемами, которые модель не сходится с информацией ниже:
[code]C:\Users\Admin\anaconda3\envs\tf\lib\site-packages\scipy\optimize\_optimize.py:1291: OptimizeWarning: Maximum number of iterations has been exceeded.
res = _minimize_bfgs(f, x0, args, fprime, callback=callback, **opts)
C:\Users\Admin\anaconda3\envs\tf\lib\site-packages\statsmodels\base\model.py:607: ConvergenceWarning: Maximum Likelihood optimization failed to converge. Check mle_retvals
warnings.warn("Maximum Likelihood optimization failed to "
[/code]
Как устранить эту ошибку? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79139968/how-can-we-calculate-mean-absolute-error-mae-for-zero-inflated-poisson-regress[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как мы можем рассчитать среднюю абсолютную ошибку (MAE) для регрессии Пуассона с нулевым завышением и отрицательной бино

Последнее сообщение Anonymous « 30 окт 2024, 10:04
Добавлено в форуме Python

Anonymous » 30 окт 2024, 10:04 » в форуме Python

Теперь я пытаюсь использовать Python для расчета средней абсолютной ошибки (MAE) при выполнении регрессии Пуассона с нулевым завышением и отрицательной биномиальной регрессии с нулевым увеличением.
Я разделил данные на данные обучения и данные...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 10:04
Как мы можем рассчитать среднюю абсолютную ошибку (MAE) для регрессии Пуассона с нулевым завышением и отрицательной бино

Последнее сообщение Anonymous « 30 окт 2024, 13:03
Добавлено в форуме Python

Anonymous » 30 окт 2024, 13:03 » в форуме Python

Теперь я пытаюсь использовать Python для расчета средней абсолютной ошибки (MAE) при выполнении регрессии Пуассона с нулевым завышением и отрицательной биномиальной регрессии с нулевым увеличением.
Я разделил данные на данные обучения и данные...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 13:03
Как мы можем рассчитать среднюю абсолютную ошибку (MAE) для регрессии Пуассона с нулевым завышением и отрицательной бино

Последнее сообщение Anonymous « 30 окт 2024, 23:27
Добавлено в форуме Python

Anonymous » 30 окт 2024, 23:27 » в форуме Python

Я пытаюсь использовать Python для расчета средней абсолютной ошибки (MAE) при выполнении регрессии Пуассона с нулевым завышением и отрицательной биномиальной регрессии с нулевым увеличением.
Я разделил данные на данные обучения и данные...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 23:27
Как смягчить высокую MAE/MSE в линейной регрессии градиентного происхождения? [закрыто]

Последнее сообщение Anonymous « 11 мар 2025, 23:28
Добавлено в форуме Python

Anonymous » 11 мар 2025, 23:28 » в форуме Python

Я узнаю об алгоритмах машинного обучения, внедряя их с нуля. Начиная с оснований, я работаю над линейной регрессией. Тем не менее, я сталкиваюсь с проблемами с производительностью модели. Учитывая простоту набора данных, я ожидал, что модель будет...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
11 мар 2025, 23:28
Список BigDecimal: как вычислить абсолютную разницу между элементами, не смежными с нулевым значением, с помощью Java 8

Последнее сообщение Anonymous « 03 янв 2025, 10:09
Добавлено в форуме JAVA

Anonymous » 03 янв 2025, 10:09 » в форуме JAVA

У меня есть список BigDecimal, который может быть элементами:
1 = 76.2372
2 = 0E-4
3 = 80.2318
4 = 82.1111
5 = 88.0937

Я хотел бы вычислить абсолютную разницу между элементами, значение которых не близко к нулю, в этом примере разница между...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
03 янв 2025, 10:09

Вернуться в «Python»