Фильтрация по уникальному количеству внутри группPython

Программы на Python
Ответить
Anonymous
 Фильтрация по уникальному количеству внутри групп

Сообщение Anonymous »

Я пытаюсь фильтровать по количеству уникальных элементов в группах.
Например, предположим, что у меня есть следующий набор данных:

Код: Выделить всё

import polars as pl

df = pl.DataFrame({
'data': [1,1,1,1,1,2,2],
'group': [1,1,1,2,2,1,1],
'id': [1,2,3,4,5,1,2],
'x': [1,1,2,1,2,1,1]
})
Где (данные, группа) — составной ключ для групп элементов, каждый из которых имеет значение «id» и «x». Я хотел бы отфильтровать набор данных, чтобы сохранять только группы, имеющие как минимум два разных значения x: 1 и 2.
Я попробовал следующее, но получил сообщение об ошибке:

Код: Выделить всё

df.filter(pl.col('x').unique_counts().over('data', 'group') >= 2)

Код: Выделить всё

# ShapeError: the length of the window expression did not match that of the group
Может кто-нибудь помочь мне понять, что я делаю неправильно или как достичь этой цели?


Подробнее здесь: https://stackoverflow.com/questions/783 ... hin-groups
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»