import numpy as np
import pandas as pd
df = pd.DataFrame({
val: np.random.randint(1,5,100) for val in ['a','b','c','d','x','y','z']
})
df.groupby('a').apply(lambda df:
df.sort_values('c')
.groupby('d')
[['x','y','z']]
.agg(['max','mean','median'])
)
Вывод (со сглаженным мультииндексом для вставки сюда):
Как переписать в полярах?
Основная идея упражнения заключается в том, что в приложении я могу что-то сделать со всей группой фреймов данных, например. отсортируйте их, а затем агрегируйте (я знаю, что это бессмысленно, но идея заключается в свободе делать что угодно). Теряю ли я эту свободу, если хочу, чтобы мой код можно было распараллеливать, или есть способ охватить всю группу? Я попробовал pl.all(), но не смог понять, как хотя бы отсортировать каждый sub-df
Я перехожу с панд, поэтому, пожалуйста, извините мой непараллельный мозг. Предположим, у нас есть следующий код pandas: [code]import numpy as np import pandas as pd
df = pd.DataFrame({ val: np.random.randint(1,5,100) for val in ['a','b','c','d','x','y','z'] })
Как переписать в полярах? Основная идея упражнения заключается в том, что в приложении я могу что-то сделать со всей группой фреймов данных, например. отсортируйте их, а затем агрегируйте (я знаю, что это бессмысленно, но идея заключается в свободе делать [b]что угодно[/b]). Теряю ли я эту свободу, если хочу, чтобы мой код можно было распараллеливать, или есть способ охватить всю группу? Я попробовал pl.all(), но не смог понять, как хотя бы отсортировать каждый sub-df
Я пытаюсь понять, как динамически создавать агрегаты с вложенными и обычными фильтрами для обычных или вложенных полей, поэтому мой окончательный запрос выглядит как код ниже, и было бы хорошо, если бы его можно было упростить до двух уровней...
Я пытаюсь захватить строковые стороны ABBB , abb , ab , , c ### , c#, C и т. Д. В одну группу и все, что следует (все, что не является b , #) в отдельную группу.
Я использую эту режиму:
sample = Cbb-7 # for testing purposes
re.search(r (...
Смотрите код ниже, это замена того, что мне нужно. ChatGPT и недоумение здесь не помогут. На практике я могу вычислять столбцы col1 и col2 по одному, но это неоправданно медленно.
import numpy as np
import polars as pl
Смотрите код ниже, это замена того, что мне нужно. ChatGPT и недоумение здесь не помогут. На практике я могу вычислять столбцы col1 и col2 по одному, но это неоправданно медленно.
import numpy as np
import polars as pl