df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum()
.over("month", order_by=pl.col("sum_share").reverse()))
< /code>
Этот код создал какую -то аду и чепуху. и я пришел к выводу, чтобы не использовать сортировку внутри «над» вообще, а только для того, чтобы сделать очевидную «сортировку» перед добавлением столбца. необходимо и что это за использование, если вы не можете сделать заказ DECS, хотя это не часто используется < /p>
df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum()
.over("month"))
< /code>
# this worked
(df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum(reverse=True)
.over("month", order_by=pl.col("sum_share")))\
.with_columns(share_of_m_for_merch=pl.col("month").n_unique().over('merchant_id'),
help=pl.col('cumulative_sales').filter(pl.col('cumulative_sales')>=0.2).min().over('month'))\
.filter(pl.col('cumulative_sales')
Это пример выходных данных для получения единиц (их минимальное число из -за спермы), которые приносят 20% дохода ежемесячно. Создан одинаково с cum_sum (reample = true)
Я изучал поляры чуть более недели и не могу понять, как провести аналог SQL Sum (...) Over (раздел по ... порядок ... desc) [code]df.group_by('merchant_id', 'month')\ .agg(sum_share=pl.col('amount').sum())\ .with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\ .sort(['month', 'sum_share'], descending=[False,True])\ .with_columns( cumulative_sales=pl.col("sum_share") .cum_sum() .over("month", order_by=pl.col("sum_share").reverse())) < /code> Этот код создал какую -то аду и чепуху. и я пришел к выводу, чтобы не использовать сортировку внутри «над» вообще, а только для того, чтобы сделать очевидную «сортировку» перед добавлением столбца. необходимо и что это за использование, если вы не можете сделать заказ DECS, хотя это не часто используется < /p> df.group_by('merchant_id', 'month')\ .agg(sum_share=pl.col('amount').sum())\ .with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\ .sort(['month', 'sum_share'], descending=[False,True])\ .with_columns( cumulative_sales=pl.col("sum_share") .cum_sum() .over("month")) < /code> # this worked (df.group_by('merchant_id', 'month')\ .agg(sum_share=pl.col('amount').sum())\ .with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\ .sort(['month', 'sum_share'], descending=[False,True])\ .with_columns( cumulative_sales=pl.col("sum_share") .cum_sum(reverse=True) .over("month", order_by=pl.col("sum_share")))\ .with_columns(share_of_m_for_merch=pl.col("month").n_unique().over('merchant_id'), help=pl.col('cumulative_sales').filter(pl.col('cumulative_sales')>=0.2).min().over('month'))\ .filter(pl.col('cumulative_sales') Это пример выходных данных для получения единиц (их минимальное число из -за спермы), которые приносят 20% дохода ежемесячно. Создан одинаково с cum_sum (reample = true) [/code] и cum_sum ()
Я изучаю поляры чуть больше недели и не могу понять, как сделать аналог sql sum(...) over(partition by... order by... DESC)
df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\...
Я изучал поляры чуть более недели и не могу понять, как провести аналог SQL Sum (...) Over (раздел по ... порядок ... desc)
df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\...
Я изучал поляры чуть более недели и не могу понять, как провести аналог SQL Sum (...) Over (раздел по ... порядок ... desc)
df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\...
Я изучал поляры чуть более недели и не могу понять, как провести аналог SQL Sum (...) Over (раздел по ... порядок ... desc)
df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\...