Как улучшить модель SARIMAX, чтобы прогноз был более точным? - Цифровое Кемерово

Как улучшить модель SARIMAX, чтобы прогноз был более точным? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как улучшить модель SARIMAX, чтобы прогноз был более точным?

Цитата

Сообщение Anonymous » 17 окт 2024, 12:44

Моя цель — спрогнозировать продажи продукта на конец месяца, используя модель SARIMAX. Указанный набор данных представляет собой ежедневную дату с соответствующими продажами на каждую дату. Похоже, что набор данных имеет ежемесячную сезонность (и годовую сезонность, но об этом речь пойдет позже). Более того, у меня также есть будние дни в качестве экзогенной переменной, так как по выходным продаж не будет (продажи = 0).
набор данных
график набора данных
набор данных
график набора данных
набор данных
график набора данных
p>
Seasonal_decompose
Сначала я проверил стационарность данных с помощью теста Дики Фуллера и получил значение p как 0,000002, что меньше 0,05, следовательно, данные стационарный. Поэтому я попытался найти p,d,q и P,D,Q, используя autoarima из pmarima с m=30.

Код: Выделить всё

import pmdarima as pm

SARIMA_model = pm.auto_arima(df['Premium'].iloc[0:911], start_p=1, start_q=1,
test='adf',
max_p=3, max_q=3,
m=30,
start_P=0,
seasonal=True,
d=None,
D=1,
trace=False,
error_action= 'ignore',
suppress_warnings=True,
stepwise=True)

Я получил order=(2,0,0), Seasonal_order=(2,1,0,30) с AIC = 21569,538 и BIC = 21591,946.
Затем я тренировался и использовал модель для прогнозирования на тестовом наборе, я получил MAPE как 127.722, ошибку MSE: 1.132537192e+13 и
ошибку RMSE: 3365318.993.
Прогноз SARIMA (2,0 ,0),(2,1,0,30)
После этого я попытался улучшить его, включив экзогенную переменную в качестве дней недели.

Код: Выделить всё

exog=train['Weekday_detect']

Я использовал SARIMAX(2, 0, 0)x(2, 1, 0, 30) с AIC = 22177,846 и BIC = 22218,492. -> как-то хуже, чем модель SARIMA
Предсказание SARIMAX (2,0,0)x(2,1,0,30)
Я получил MAPE = 172.365, ошибка MSE: 1.2762327619e+13 и ошибка RMSE: 3.5724400092e+06.
Поэтому мой вопрос - где это могло пойти не так, имея не совсем-плохое- оранжевые линии прогнозирования по сравнению с невероятно большими MAPE, MSE и RMSE? Что является причиной таких больших цифр? Как я могу улучшить эту модель, чтобы она была более точной? Может ли быть причиной этого годовая сезонность, о которой я здесь не упомянул?
И как подойти к включению годовой сезонности в эту модель?

Подробнее здесь: https://stackoverflow.com/questions/787 ... e-accurate

Реклама

1729158291

Anonymous

Моя цель — спрогнозировать продажи продукта на конец месяца, используя модель SARIMAX. Указанный набор данных представляет собой ежедневную дату с соответствующими продажами на каждую дату. Похоже, что набор данных имеет ежемесячную сезонность (и годовую сезонность, но об этом речь пойдет позже). Более того, у меня также есть будние дни в качестве экзогенной переменной, так как по выходным продаж не будет (продажи = 0).
набор данных
график набора данных
набор данных
график набора данных
набор данных
график набора данных
p>
Seasonal_decompose
Сначала я проверил стационарность данных с помощью теста Дики Фуллера и получил значение p как 0,000002, что меньше 0,05, следовательно, данные стационарный. Поэтому я попытался найти p,d,q и P,D,Q, используя autoarima из pmarima с m=30.
[code]import pmdarima as pm

SARIMA_model = pm.auto_arima(df['Premium'].iloc[0:911], start_p=1, start_q=1,
test='adf',
max_p=3, max_q=3,
m=30,
start_P=0,
seasonal=True,
d=None,
D=1,
trace=False,
error_action= 'ignore',
suppress_warnings=True,
stepwise=True)
[/code]
Я получил order=(2,0,0), Seasonal_order=(2,1,0,30) с AIC = 21569,538 и BIC = 21591,946.
Затем я тренировался и использовал модель для прогнозирования на тестовом наборе, я получил MAPE как 127.722, ошибку MSE: 1.132537192e+13 и
ошибку RMSE: 3365318.993.
Прогноз SARIMA (2,0 ,0),(2,1,0,30)
После этого я попытался улучшить его, включив экзогенную переменную в качестве дней недели.
[code]exog=train['Weekday_detect']
[/code]
Я использовал SARIMAX(2, 0, 0)x(2, 1, 0, 30) с AIC = 22177,846 и BIC = 22218,492. -> как-то хуже, чем модель SARIMA
Предсказание SARIMAX (2,0,0)x(2,1,0,30)
Я получил MAPE = 172.365, ошибка MSE: 1.2762327619e+13 и ошибка RMSE: 3.5724400092e+06.
Поэтому мой вопрос - где это могло пойти не так, имея не совсем-плохое- оранжевые линии прогнозирования по сравнению с невероятно большими MAPE, MSE и RMSE? Что является причиной таких больших цифр? Как я могу улучшить эту модель, чтобы она была более точной? Может ли быть причиной этого годовая сезонность, о которой я здесь не упомянул?
И как подойти к включению годовой сезонности в эту модель? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78749114/how-to-improve-sarimax-model-to-forecast-more-accurate[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Season_order в statsmodels.tsa.statespace.sarimax.SARIMAX для ежедневных данных

Последнее сообщение Anonymous « 19 окт 2023, 16:47
Добавлено в форуме Python

Anonymous » 19 окт 2023, 16:47 » в форуме Python

У меня, надеюсь, простой вопрос.

Я пытаюсь понять, как установить s для сезонного порядка в контексте statsmodels.tsa.statespace.sarimax.SARIMAX. Согласно документации: s — целое число, указывающее периодичность (количество периодов в сезоне),...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 16:47
При вращении объекта вокруг целевого объекта радиус не выглядит очень точным на 100%. как сделать радиус точным?

Последнее сообщение Anonymous « 24 апр 2024, 04:40
Добавлено в форуме C#

Anonymous » 24 апр 2024, 04:40 » в форуме C#

Я установил в инспекторе значение радиуса 0,1, но когда оно вращается вокруг персонажа игрока, кажется, что радиус тогда больше. 0,1
когда я устанавливаю радиус примерно 1,6 во время выполнения или в режиме редактирования, сфера оказывается очень...

0 Ответы

95 Просмотры

Последнее сообщение Anonymous
24 апр 2024, 04:40
Могу ли я улучшить прогноз своей модели намного больше?

Последнее сообщение Anonymous « 13 май 2024, 10:16
Добавлено в форуме Python

Anonymous » 13 май 2024, 10:16 » в форуме Python

Вот моя интерпретация моей модели на данный момент: я исследую взаимосвязь между рейтингом и подписчиками в видеоиграх, но есть проблема. Чем больше у вас высоких рейтингов, тем больше у вас подписчиков, но их очень мало.
from sklearn.preprocessing...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
13 май 2024, 10:16
Как улучшить прогноз осадков, когда большинство значений в наборе данных равны нулю?

Последнее сообщение Anonymous « 02 май 2025, 18:15
Добавлено в форуме Python

Anonymous » 02 май 2025, 18:15 » в форуме Python

Я работаю над проектом прогнозирования осадков с использованием моделей временных рядов, таких как LSTM, Arima и Prophet в Google Colab. Набор данных, который я использую, содержит ежедневные значения осадков, но подавляющее большинство записей...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
02 май 2025, 18:15
SARIMA и SARIMAX определяют длину прогноза и длину ввода

Последнее сообщение Гость « 21 сен 2023, 20:42
Добавлено в форуме Python

Гость » 21 сен 2023, 20:42 » в форуме Python

Можно ли определить в модели ARIMA, SARIMA и SARIMAX длину прогноза, например 50 (50 часов) и длина ввода, например. 100 (часов), как и в случае с моделями RNN, LSTM и GRU. После этого я хочу сравнить прогнозы различных моделей в тестовых данных,...

0 Ответы

110 Просмотры

Последнее сообщение Гость
21 сен 2023, 20:42

Вернуться в «Python»

Programmiererforum