У меня есть следующая схема источника данных:
Введите описание изображения здесь < /p>
Я кодирует 'Дату' Столбец на три отдельных столбца:
Год, месяц, дата. < /p>
Мои будущие -
device_id; enuration_energy; Год; месяц; день < /p>
Введите описание изображения здесь < /p>
Я хотел бы предсказать enurning_energy для предоставления фьючерса (идентификатор устройства и дата). Потребление энергии-это счетчик устройства, который растут изо дня в день
Я создал матрицу корелляции, чтобы увидеть корреляцию между атрибутами, и я вижу, что корреляция между emence_energy и устройством очень низкая (-0,15).
Вот модель метрики для модельной подготовки:
'rmse': np.float64 (0,7648236497453013), 'r2_score': 0,41662485203361777, 'coeficicients': ray (-0,590674255, 0,617666666676, '. , 0,04103179, 0,00336239]]), «перехват»: массив ([0,00086466] < /p>
, когда я загружаю данные только с одним устройством_ид, результат лучше:
'rmse': np .float64 (0,1045133437744489), «r2_score»: 0,9894746517207146, «коэффициенты»: массив ([0., 0,99656364, 0,06202053, 0,00616694]]), 'intercte': array (0.0.00065. > > Должен ли я создать метод прогнозирования, который сначала выбирает данные для данного device_id и создать новую кадр данных для этих конкретных устройств, создавать модель и предсказать? Это может потреблять время, и мне нужно будет сделать этот расчет для каждого прогноза на Deman. Это, если я хотел бы сохранить модель/picke и использовать ее для обслуживания данных? (Мои данные имеют много устройств) совместный фактор. Должен ли я использовать другую модель ML? P>
Подробнее здесь: https://stackoverflow.com/questions/794 ... ce-with-py
Как создать модель машинного обучения и регрессии линии для конкретного устройства с Python и Scikit-Learn ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение