Я работаю над проектом прогнозирования временных рядов, целью которого является прогнозирование энергопотребления нагрузки на основе различных характеристик, включая дату и время, индикаторы праздников и сезонную информацию. Несмотря на этапы предварительной обработки, такие как обнаружение выбросов, разработка функций и испытание различных алгоритмов машинного обучения, включая модели LSTM, CNN, ConvLSTM, я изо всех сил пытаюсь достичь удовлетворительной производительности. Я внедрил методы обнаружения выбросов для выявления и удаления выбросов из набора данных, особенно в целевом столбце. Однако даже после удаления выбросов производительность модели остается неоптимальной. Я также выполнил разработку функций, извлекая функции даты и времени из столбца datetime и закодировав категориальные функции, такие как времена года. Ожидалось, что эти функции повысят точность модели, но результаты оказались разочаровывающими. Я обучал модели с различной архитектурой и гиперпараметрами, но не заметил значительного улучшения производительности. Я пробовал настраивать скорость обучения, корректировать размеры слоев и методы регуляризации, но модель по-прежнему не может эффективно уловить основные закономерности. Я экспериментировал с преобразованиями данных, такими как логарифмическое преобразование и преобразование квадратного корня, чтобы обрабатывать нелинейные связи и улучшать распределение целевой переменной, которое смещено вправо, как видно на рисунке. Однако эти преобразования не привели к существенному улучшению производительности модели. вы найдете в приложении распределение данных и различные применяемые этапы обработки. [[[введите описание изображения здесь](


Мне нужен совет и рекомендации о том, как решить эти проблемы и повысить эффективность моей модели прогнозирования. Будем очень признательны за любые предложения относительно альтернативных методов предварительной обработки, стратегий выбора функций, архитектуры моделей или подходов к настройке гиперпараметров. спасибо