Код: Выделить всё
df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum()
.over("month", order_by=pl.col("sum_share").reverse()))
но тогда возникает вопрос, почему этот порядок по нужен и какой от него толк, если вы не можете выполнить порядок по убыванию, хотя это используется нечасто
Код: Выделить всё
df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum()
.over("month"))
# this worked
.agg(sum_share=pl.col('amount').sum())
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))
.sort(['month', 'sum_share'], по убыванию=[False,True])
.with_columns(
cumulative_sales=pl.col("sum_share ")
.cum_sum(reverse=True)
.over("месяц", order_by=pl.col("sum_share")))
.with_columns(share_of_m_for_merch=pl.col("month").n_unique().over('merchant_id'),
help=pl.col('cumulative_sales').filter(pl.col('cumulative_sales') ')>=0.2).min().over('месяц'))
.filter(pl.col('cumulative_sales')
Подробнее здесь: https://stackoverflow.com/questions/793 ... -in-polars