Как перевести вложенную группу, применив агрегацию от панд к полярам?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как перевести вложенную группу, применив агрегацию от панд к полярам?

Сообщение Anonymous »

Я перехожу с панд, поэтому, пожалуйста, извините мой непараллельный мозг. Предположим, у нас есть следующий код pandas:

Код: Выделить всё

import numpy as np
import pandas as pd

df = pd.DataFrame({
val:  np.random.randint(1,5,100) for val in ['a','b','c','d','x','y','z']
})

df.groupby('a').apply(lambda df:
df.sort_values('c')
.groupby('d')
[['x','y','z']]
.agg(['max','mean','median'])
)
Вывод (со сглаженным мультииндексом для вставки сюда):



a
d
0
1
2
3
4
5
6
7
8






x
x
x
y
y
y
z
z
z




< td>сумма
среднее
медиана
сумма
среднее
медиана
сумма
среднее
медиана< /td>


1
1
15.0
3,75
4,0
12,0
3,0
3,5
12,0
3,0
3,0


1
2
9.0
3,0
3,0
5,0
1,6666671.0
9.0
3.0
4.0


1
3
33,0
3,0
3,0
30,0
2,727273
3,0
27,0
2,454545
2,0


1
4
23,0
< td>2,8750
3,0
16,0
2,0
2,0
15,0
1,8750
1,0

2
1
18,0
2,571429
2,0
13,0
1,857143
2,0
18,0
2,571429
3,0


2
2
18,0
2,0
1.0
23.0
2.555556
2.025,0
2,777778
3,0


2
3
11,0
3,666667
4.0
9.0
3.0
3.0
9,0
3,0
4,0


2
4
3,0
1,50
< td>1,50
6,0
3,0
3,0
4.0
2.0
2.0


3
1
28,0
2,80
3,0
21,0
2,10
2,0
29,0
2,90
3,0


3< /td>
2
13,0
2,166667
2,0
19,0
3,166667
3,0
18,03.0
3.0


3
3
16,0
1,777778
2,0
22,0
2,444444
3,0
32,0
3.555556
4.0


3
4
20,0
2,222222
2,0
< td>23,0
2,555556
2,0
23,0
2.555556
3.0


4
1
9,0
2,250
2,0
10,0
2,50
2,50
5,0
1,250
1.0


4
2< /td>
19,0
3,166667
3,0
8,0
1,333333
1,0
22,0
3,6666674.0


4
3
10,0
2,0
1,0
14,0
2,80
3,0
15,0
3,0
3.0


4
4
9,0
2,250
2,0
12,0
< td>3,0
3,0
10,0
2,50
2.50



Как переписать в полярах?
Основная идея упражнения заключается в том, что в приложении я могу что-то сделать со всей группой фреймов данных, например. отсортируйте их, а затем агрегируйте (я знаю, что это бессмысленно, но идея заключается в свободе делать что угодно). Теряю ли я эту свободу, если хочу, чтобы мой код можно было распараллеливать, или есть способ охватить всю группу? Я попробовал pl.all(), но не смог понять, как хотя бы отсортировать каждый sub-df

Подробнее здесь: https://stackoverflow.com/questions/720 ... -to-polars
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Конвертировать панд, применить к полярам
    Anonymous » » в форуме Python
    0 Ответы
    18 Просмотры
    Последнее сообщение Anonymous
  • Может ли кто-нибудь помочь мне упростить сложную вложенную агрегацию в Elasticsearch? Или это конечный результат
    Anonymous » » в форуме Elasticsearch aggregation
    0 Ответы
    956 Просмотры
    Последнее сообщение Anonymous
  • Группа захвата питона, содержащая вложенную группу без капитализации
    Anonymous » » в форуме Python
    0 Ответы
    15 Просмотры
    Последнее сообщение Anonymous
  • Как применитьroll_map к полярам и создать два столбца?
    Anonymous » » в форуме Python
    0 Ответы
    16 Просмотры
    Последнее сообщение Anonymous
  • Как применитьroll_map к полярам и создать два столбца?
    Anonymous » » в форуме Python
    0 Ответы
    13 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»