Код: Выделить всё
import pandas as pd
data = {
'date': ['2023-01-01 00:00:00', '2023-01-01 06:00:00', '2023-01-01 12:00:00',
'2023-01-02 00:00:00', '2023-01-02 06:00:00', '2023-01-03 00:00:00'],
'x': [1, 1, 1, 2, 2, 1],
'y': ['A', 'A', 'A', 'B', 'B', 'A'],
'z': [10, 10, 10, 20, 20, 10]
}
df = pd.DataFrame(data)
df['date'] = pd.to_datetime(df['date'])
print(df)
- : временные метки
Код: Выделить всё
date
- , y, z: группировка идентификаторов
Код: Выделить всё
x
Код: Выделить всё
6H). Цель — получить диапазоны дат для каждой группы с совпадающими значениями x
Вот иллюстрация желаемого результата:
x
y
z
date_range< /th>
1
< td>A
10
01.01.2023 00:00:00 по 01.01.2023 12:00:00
2
B
20
2023-01-02 00:00:00 по 2023-01-02 06:00:00
1
A
10
03.01.2023 00:00 от :00 до 03-01-2023 00:00:00
Я пробовал использовать groupby со специальной функцией агрегирования, а также merge_asof для учета 6-часового перерыва, но ни один из подходов не сработал должным образом для создания правильных группировок.
Как я могу добиться этой группировки в Pandas?
Подробнее здесь: https://stackoverflow.com/questions/790 ... ate-ranges