Как перевести вложенную группу, применив агрегацию от панд к полярам? - Цифровое Кемерово

Как перевести вложенную группу, применив агрегацию от панд к полярам? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как перевести вложенную группу, применив агрегацию от панд к полярам?

Цитата

Сообщение Anonymous » 17 окт 2024, 00:59

Я перехожу с панд, поэтому, пожалуйста, извините мой непараллельный мозг. Предположим, у нас есть следующий код pandas:

Код: Выделить всё

import numpy as np
import pandas as pd

df = pd.DataFrame({
val:  np.random.randint(1,5,100) for val in ['a','b','c','d','x','y','z']
})

df.groupby('a').apply(lambda df:
df.sort_values('c')
.groupby('d')
[['x','y','z']]
.agg(['max','mean','median'])
)

Вывод (со сглаженным мультииндексом для вставки сюда):

a
d
0
1
2
3
4
5
6
7
8

x
x
x
y
y
y
z
z
z

< td>сумма
среднее
медиана
сумма
среднее
медиана
сумма
среднее
медиана< /td>

1
1
15.0
3,75
4,0
12,0
3,0
3,5
12,0
3,0
3,0

1
2
9.0
3,0
3,0
5,0
1,6666671.0
9.0
3.0
4.0

1
3
33,0
3,0
3,0
30,0
2,727273
3,0
27,0
2,454545
2,0

1
4
23,0
< td>2,8750
3,0
16,0
2,0
2,0
15,0
1,8750
1,0

2
1
18,0
2,571429
2,0
13,0
1,857143
2,0
18,0
2,571429
3,0

2
2
18,0
2,0
1.0
23.0
2.555556
2.025,0
2,777778
3,0

2
3
11,0
3,666667
4.0
9.0
3.0
3.0
9,0
3,0
4,0

2
4
3,0
1,50
< td>1,50
6,0
3,0
3,0
4.0
2.0
2.0

3
1
28,0
2,80
3,0
21,0
2,10
2,0
29,0
2,90
3,0

3< /td>
2
13,0
2,166667
2,0
19,0
3,166667
3,0
18,03.0
3.0

3
3
16,0
1,777778
2,0
22,0
2,444444
3,0
32,0
3.555556
4.0

3
4
20,0
2,222222
2,0
< td>23,0
2,555556
2,0
23,0
2.555556
3.0

4
1
9,0
2,250
2,0
10,0
2,50
2,50
5,0
1,250
1.0

4
2< /td>
19,0
3,166667
3,0
8,0
1,333333
1,0
22,0
3,6666674.0

4
3
10,0
2,0
1,0
14,0
2,80
3,0
15,0
3,0
3.0

4
4
9,0
2,250
2,0
12,0
< td>3,0
3,0
10,0
2,50
2.50

Как переписать в полярах?
Основная идея упражнения заключается в том, что в приложении я могу что-то сделать со всей группой фреймов данных, например. отсортируйте их, а затем агрегируйте (я знаю, что это бессмысленно, но идея заключается в свободе делать что угодно). Теряю ли я эту свободу, если хочу, чтобы мой код можно было распараллеливать, или есть способ охватить всю группу? Я попробовал pl.all(), но не смог понять, как хотя бы отсортировать каждый sub-df

Подробнее здесь: https://stackoverflow.com/questions/720 ... -to-polars

Реклама

1729115954

Anonymous

Я перехожу с панд, поэтому, пожалуйста, извините мой непараллельный мозг.  Предположим, у нас есть следующий код pandas:
[code]import numpy as np
import pandas as pd

df = pd.DataFrame({
val:  np.random.randint(1,5,100) for val in ['a','b','c','d','x','y','z']
})

df.groupby('a').apply(lambda df:
df.sort_values('c')
.groupby('d')
[['x','y','z']]
.agg(['max','mean','median'])
)
[/code]
Вывод (со сглаженным мультииндексом для вставки сюда):



a
d
0
1
2
3
4
5
6
7
8






x
x
x
y
y
y
z
z
z




< td>сумма
среднее
медиана
сумма
 среднее
медиана
сумма
среднее
медиана< /td>


1
1
15.0 
3,75
4,0
12,0
3,0
3,5
12,0
3,0
3,0


1
2
9.0
3,0
3,0
5,0
1,6666671.0
9.0
3.0
4.0


1
3
33,0
3,0
3,0
30,0
2,727273
3,0
27,0
2,454545
2,0


1
4
23,0
< td>2,8750
3,0
16,0
2,0
 2,0
15,0
1,8750
1,0

2
1
18,0
2,571429 
2,0
13,0
1,857143
2,0
18,0
2,571429
3,0


2
2
18,0
2,0
1.0
23.0
2.555556
2.025,0
2,777778
3,0


2
3
11,0
3,666667
4.0
9.0
3.0
3.0
9,0
3,0
4,0


2
4
3,0
1,50
< td>1,50
6,0
3,0
3,0
 4.0
2.0
2.0


3
1
28,0
2,80
3,0 
21,0
2,10
2,0
29,0
2,90
3,0


3< /td>
2
13,0
2,166667
2,0
19,0
3,166667
3,0
18,03.0
3.0


3
3
16,0
1,777778
2,0
22,0
2,444444
3,0
32,0
3.555556
4.0


3
4
20,0
2,222222
2,0
< td>23,0
2,555556
2,0
23,0
 2.555556
3.0


4
1
9,0
2,250
2,0
10,0 
2,50
2,50
5,0
1,250
1.0


4
2< /td>
19,0
3,166667
3,0
8,0
1,333333
1,0
22,0
3,6666674.0


4
3
10,0
2,0
1,0
14,0
2,80
3,0
15,0
3,0
3.0


4
4
9,0
2,250
2,0
12,0
< td>3,0
3,0
10,0
2,50
 2.50



Как переписать в полярах?
Основная идея упражнения заключается в том, что в приложении я могу что-то сделать со всей группой фреймов данных, например.  отсортируйте их, а затем агрегируйте (я знаю, что это бессмысленно, но идея заключается в свободе делать [b]что угодно[/b]). Теряю ли я эту свободу, если хочу, чтобы мой код можно было распараллеливать, или есть способ охватить всю группу? Я попробовал pl.all(), но не смог понять, как хотя бы отсортировать каждый sub-df 

Подробнее здесь: [url]https://stackoverflow.com/questions/72019712/how-to-translate-a-nested-groupby-apply-aggregation-from-pandas-in-to-polars[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Конвертировать панд, применить к полярам

Последнее сообщение Anonymous « 13 окт 2024, 18:02
Добавлено в форуме Python

Anonymous » 13 окт 2024, 18:02 » в форуме Python

Я новичок в полярах Python и пытаюсь преобразовать следующий код pandas в поляры.
df.apply(lambda x: x .compute(data), axis=1, expand = True)

Столбец obj в кадре данных df состоит из объектов, имеющих функциональное свойство с именем compute ....

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
13 окт 2024, 18:02
Может ли кто-нибудь помочь мне упростить сложную вложенную агрегацию в Elasticsearch? Или это конечный результат

Последнее сообщение Anonymous « 09 май 2024, 23:21
Добавлено в форуме Elasticsearch aggregation

Anonymous » 09 май 2024, 23:21 » в форуме Elasticsearch aggregation

Я пытаюсь понять, как динамически создавать агрегаты с вложенными и обычными фильтрами для обычных или вложенных полей, поэтому мой окончательный запрос выглядит как код ниже, и было бы хорошо, если бы его можно было упростить до двух уровней...

0 Ответы

956 Просмотры

Последнее сообщение Anonymous
09 май 2024, 23:21
Группа захвата питона, содержащая вложенную группу без капитализации

Последнее сообщение Anonymous « 07 фев 2025, 14:32
Добавлено в форуме Python

Anonymous » 07 фев 2025, 14:32 » в форуме Python

Я пытаюсь захватить строковые стороны ABBB , abb , ab , , c ### , c#, C и т. Д. В одну группу и все, что следует (все, что не является b , #) в отдельную группу.
Я использую эту режиму:
sample = Cbb-7 # for testing purposes
re.search(r (...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
07 фев 2025, 14:32
Как применитьroll_map к полярам и создать два столбца?

Последнее сообщение Anonymous « 02 июл 2024, 16:47
Добавлено в форуме Python

Anonymous » 02 июл 2024, 16:47 » в форуме Python

Смотрите код ниже, это замена того, что мне нужно. ChatGPT и недоумение здесь не помогут. На практике я могу вычислять столбцы col1 и col2 по одному, но это неоправданно медленно.
import numpy as np
import polars as pl

def _compute_coef1(series):...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 16:47
Как применитьroll_map к полярам и создать два столбца?

Последнее сообщение Anonymous « 02 июл 2024, 18:31
Добавлено в форуме Python

Anonymous » 02 июл 2024, 18:31 » в форуме Python

Смотрите код ниже, это замена того, что мне нужно. ChatGPT и недоумение здесь не помогут. На практике я могу вычислять столбцы col1 и col2 по одному, но это неоправданно медленно.
import numpy as np
import polars as pl

def _compute_coef1(series):...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 18:31

Вернуться в «Python»

Programmiererforum