Распознавание образов с временными рядами

Распознавание образов с временными рядами ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Распознавание образов с временными рядами

Цитата

Сообщение Anonymous » 04 мар 2026, 05:30

Я работаю над данными о потреблении электроэнергии компании за последние 5 лет (миллионы строк в формате CSV).
Каждая строка имеет следующую структуру:

Код: Выделить всё

timestamp, consumption
2020-01-01 00:00:00, 1250
2020-01-01 00:15:00, 1310
2020-01-01 00:30:00, 1285
...

Интервал выборки составляет 15 минут.
Моя цель — обнаружить наиболее повторяющийся шаблон потребления (мотив) по всему набору данных.
Ограничения:
Длительность подпоследовательности является переменной (продолжительность мотива не фиксирована).
Мне нужно автоматически определять временные метки начала и окончания каждого обнаруженного подпоследовательность.
Набор данных содержит миллионы точек, поэтому масштабируемость важна.
Я работаю на Python.
Я рассматривал подходы, основанные на сходстве, такие как DTW, но не знаю, как:
Эффективно обрабатывать подпоследовательности переменной длины.
Определяйте точные начальные и конечные индексы каждой из них. мотив.
Масштабируйте решение до больших наборов данных.
Какой подход рекомендуется использовать для решения задачи обнаружения мотива такого типа?

Подробнее здесь: https://stackoverflow.com/questions/799 ... mes-series

1772591418

Anonymous

Я работаю над данными о потреблении электроэнергии компании за последние 5 лет (миллионы строк в формате CSV).
Каждая строка имеет следующую структуру:
[code]timestamp, consumption
2020-01-01 00:00:00, 1250
2020-01-01 00:15:00, 1310
2020-01-01 00:30:00, 1285
...
[/code]
Интервал выборки составляет 15 минут.
Моя цель — обнаружить наиболее повторяющийся шаблон потребления (мотив) по всему набору данных.
Ограничения:
Длительность подпоследовательности является переменной (продолжительность мотива не фиксирована).
Мне нужно автоматически определять временные метки начала и окончания каждого обнаруженного подпоследовательность.
Набор данных содержит миллионы точек, поэтому масштабируемость важна.
Я работаю на Python.
Я рассматривал подходы, основанные на сходстве, такие как DTW, но не знаю, как:
Эффективно обрабатывать подпоследовательности переменной длины.
Определяйте точные начальные и конечные индексы каждой из них. мотив.
Масштабируйте решение до больших наборов данных.
Какой подход рекомендуется использовать для решения задачи обнаружения мотива такого типа?

Подробнее здесь: [url]https://stackoverflow.com/questions/79900434/pattern-recognition-with-times-series[/url]