Код: Выделить всё
import pandas as pd
data = {
'date': ['2023-01-01 00:00:00', '2023-01-01 06:00:00', '2023-01-01 12:00:00',
'2023-01-02 00:00:00', '2023-01-02 06:00:00', '2023-01-03 00:00:00'],
'x': [1, 1, 1, 2, 2, 1],
'y': ['A', 'A', 'A', 'B', 'B', 'A'],
'z': [10, 10, 10, 20, 20, 10]
}
df = pd.DataFrame(data)
df['date'] = pd.to_datetime(df['date'])
print(df)
< /code>
DataFrame содержит следующие столбцы: < /p>
[list]
[*]date
[*]
Код: Выделить всё
x
[/list]
Я хочу группировать строки на основе значений в столбцах x , y и z . Кроме того, я хотел бы создать группы для строк, где разница в дате между последовательными строками составляет не более 6 часов (
Код: Выделить всё
6H
Here is an illustration of the desired output:
x < /th>
y < /th>
z < /th>
date_range < /th>
< /tr>
< /thead>
1 < /td>
1 < /td>
1 < /td> /> 10 < /td>
2023-01-01 00:00:00 до 2023-01-01 12:00:00 < /td>
< /tr>
2 < /td>
b < /td>
< /td>
b />2023-01-02 00:00:00 to 2023-01-02 06:00:00
1
A
10
2023-01-03 00:00:00 до 2023-01-03 00:00:00
Я пытался использовать группу с помощью пользовательской функции агрегации, а также MERGE_ASOF для учета 6-часовой разрывы, но ни один из них не мог создать, как ожидалось, чтобы создать правильную группу. Я достигаю этой группировки в пандах?
Подробнее здесь: https://stackoverflow.com/questions/790 ... ate-ranges