col1
col2
group_id
A
Z
1
А
Да
< td>2
A
Z
1
BZ
3
на основе такого DataFrame:
Код: Выделить всё
df = pl.DataFrame({
'col1': ['A', 'A', 'A', 'B'],
'col2': ['Z', 'Y', 'Z', 'Z']}
)
Контекст. Я хочу создать идентификатор события, поскольку в моих данных есть много подробных строк для одного события. Как только идентификатор события будет создан, я буду использовать его для выполнения различных оконных операций. Я предпочитаю иметь этот идентификатор события, а не хранить список группирующих переменных.
Подробнее здесь: https://stackoverflow.com/questions/792 ... r-group-id
Мобильная версия