У меня есть набор данных, часть которого выглядит следующим образом:
клиент
продукт
цена
количество
sale_time
C060235
P0204
6.99
2
2024-03-11 08:24:11
C045298
P0167
14.99
1
2024-03-11 08:35:06
...
C039877
P0024
126.95
1
30 сентября 2024 21:18:45
Мне нужен список уникальных клиентов, пар продуктов с общим объемом продаж, что-то вроде:
клиент
продукт
всего
C0000105
P0168
643,78
C0000105
P0204
76,88
...
C1029871
P1680
435.44
Вот моя попытка построить это. Это дает мне общую сумму всех продаж, а это не то, что мне нужно. Какой подход правильный?
import polars as pl
db.select(
(
pl.col('customer'),
pl.col('product'),
pl.col('quantity').mul(pl.col('price')).alias('total')
)
).group_by(('customer', 'product'))
Подробнее здесь: https://stackoverflow.com/questions/795 ... -in-polars