Распознавание образов с временными рядамиPython

Программы на Python
Ответить
Anonymous
 Распознавание образов с временными рядами

Сообщение Anonymous »

Я работаю над данными о потреблении электроэнергии компании за последние 5 лет (миллионы строк в формате CSV).
Каждая строка имеет следующую структуру:

Код: Выделить всё

timestamp, consumption
2020-01-01 00:00:00, 1250
2020-01-01 00:15:00, 1310
2020-01-01 00:30:00, 1285
...
Интервал выборки составляет 15 минут.
Моя цель — обнаружить наиболее повторяющийся шаблон потребления (мотив) по всему набору данных.
Ограничения:
Длительность подпоследовательности является переменной (продолжительность мотива не фиксирована).
Мне нужно автоматически определять временные метки начала и окончания каждого обнаруженного подпоследовательность.
Набор данных содержит миллионы точек, поэтому масштабируемость важна.
Я работаю на Python.
Я рассматривал подходы, основанные на сходстве, такие как DTW, но не знаю, как:
Эффективно обрабатывать подпоследовательности переменной длины.
Определяйте точные начальные и конечные индексы каждой из них. мотив.
Масштабируйте решение до больших наборов данных.
Какой подход рекомендуется использовать для решения задачи обнаружения мотива такого типа?

Подробнее здесь: https://stackoverflow.com/questions/799 ... mes-series
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»