Как сортировать внутри окна в порядке убывания в полярах

Как сортировать внутри окна в порядке убывания в полярах ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как сортировать внутри окна в порядке убывания в полярах

Цитата

Сообщение Anonymous » 26 янв 2025, 13:13

Я изучал поляры чуть более недели и не могу понять, как провести аналог SQL Sum (...) Over (раздел по ... порядок ... desc)

Код: Выделить всё

df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum()
.over("month", order_by=pl.col("sum_share").reverse()))

Этот код выдал какой-то ад и бред. и я пришел к выводу, что вообще не следует использовать сортировку внутри «по», а только выполнять очевидную «сортировку» перед добавлением столбца.
но тогда возникает вопрос, почему этот порядок по нужен и какой от него толк, если вы не можете выполнить порядок по убыванию, хотя это используется нечасто

Код: Выделить всё

df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum()
.over("month"))

# this worked

(df.group_by('merchant_id', 'месяц')

.agg(sum_share=pl.col('amount').sum())

.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))

.sort(['month', 'sum_share'], по убыванию=[False,True])

.with_columns(
cumulative_sales=pl.col("sum_share ")
.cum_sum(reverse=True)
.over("месяц", order_by=pl.col("sum_share")))

.with_columns(share_of_m_for_merch=pl.col("month").n_unique().over('merchant_id'),
help=pl.col('cumulative_sales').filter(pl.col('cumulative_sales') ')>=0.2).min().over('месяц'))

.filter(pl.col('cumulative_sales')

Подробнее здесь: https://stackoverflow.com/questions/793 ... -in-polars

1737886420

Anonymous

 Я изучал поляры чуть более недели и не могу понять, как провести аналог SQL Sum (...) Over (раздел по ... порядок ... desc) 
[code]df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum()
.over("month", order_by=pl.col("sum_share").reverse()))
[/code]
Этот код выдал какой-то ад и бред. и я пришел к выводу, что вообще не следует использовать сортировку внутри «по», а только выполнять очевидную «сортировку» перед добавлением столбца.
но тогда возникает вопрос, почему этот порядок по нужен и какой от него толк, если вы не можете выполнить порядок по убыванию, хотя это используется нечасто
[code]df.group_by('merchant_id', 'month')\
.agg(sum_share=pl.col('amount').sum())\
.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))\
.sort(['month', 'sum_share'], descending=[False,True])\
.with_columns(
cumulative_sales=pl.col("sum_share")
.cum_sum()
.over("month"))

# this worked
[/code]
(df.group_by('merchant_id', 'месяц')

.agg(sum_share=pl.col('amount').sum())

.with_columns(sum_share=pl.col('sum_share')/(pl.col('sum_share').sum().over('month')))

.sort(['month', 'sum_share'], по убыванию=[False,True])

.with_columns(
cumulative_sales=pl.col("sum_share ")
.cum_sum(reverse=True)
.over("месяц", order_by=pl.col("sum_share")))

.with_columns(share_of_m_for_merch=pl.col("month").n_unique().over('merchant_id'),
help=pl.col('cumulative_sales').filter(pl.col('cumulative_sales') ')>=0.2).min().over('месяц'))

.filter(pl.col('cumulative_sales')

Подробнее здесь: [url]https://stackoverflow.com/questions/79387448/how-to-sort-inside-a-window-in-descending-order-in-polars[/url]