Я пытаюсь найти эквивалент параметра min_count в группировке полярностей, например, в pandas.groupby(key).sum(min_count=N).
Предположим, что это фрейм данных
df = pl.from_repr("""
┌───────┬───────┐
│ fruit ┆ price │
│ --- ┆ --- │
│ str ┆ i64 │
╞═══════╪═══════╡
│ a ┆ 1 │
│ a ┆ 3 │
│ a ┆ 5 │
│ b ┆ 10 │
│ b ┆ 10 │
│ b ┆ 10 │
│ b ┆ 20 │
└───────┴───────┘
""")
Как я могу группировать по ключу Fruit с ограничением группы, имеющей не менее 4 значений суммы?
Итак вместо
┌───────┬───────┐
│ fruit ┆ price │
│ --- ┆ --- │
│ str ┆ i64 │
╞═══════╪═══════╡
│ b ┆ 50 │
│ a ┆ 9 │
└───────┴───────┘
На выходе у меня был бы только плод b, поскольку он единственный, содержащий как минимум 4 элемента
┌───────┬───────┐
│ fruit ┆ price │
│ --- ┆ --- │
│ str ┆ i64 │
╞═══════╪═══════╡
│ b ┆ 50 │
└───────┴───────┘
Подробнее здесь: https://stackoverflow.com/questions/775 ... on-groupby
Полярный эквивалент Pandas min_count при группировке ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение