Я изучаю поляры чуть больше недели и не могу понять, как сделать аналог sql sum(...) over(partition by... order by... DESC)
df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum()
.over("month", order_by=pl.col("sum_share").reverse()))
< /code>
Этот код создал какую -то аду и чепуху. и я пришел к выводу, чтобы не использовать сортировку внутри «над» вообще, а только для того, чтобы сделать очевидную «сортировку» перед добавлением столбца. необходимо и что это за использование, если вы не можете сделать заказ DECS, хотя это не часто используется < /p>
df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum()
.over("month"))
# this worked
Подробнее здесь: https://stackoverflow.com/questions/793 ... -in-polars
Как сортировать внутри окна в порядке убывания в полярах ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение