Сохраняйте только повторяющиеся строки на основе подмножества столбцов в Polars.Python

Программы на Python
Ответить
Anonymous
 Сохраняйте только повторяющиеся строки на основе подмножества столбцов в Polars.

Сообщение Anonymous »

У меня есть фрейм данных, который я хотел бы изучить и просмотреть только повторяющиеся строки на основе двух или более столбцов.
Например:
import polars as pl

df = pl.DataFrame({"A": [1, 6, 5, 4, 5, 6],
"B": ["A", "B", "C", "D", "C", "A"],
"C": [2, 2, 2, 1, 1, 1]})

Я хотел бы вернуть повторяющуюся комбинацию только для столбцов A и B. Я пробовал:
df.filter(pl.col("A", "B").is_duplicated()) # Returns: This is ambiguous. Try to combine the predicates with the 'all' or `any' expression.

При добавлении .all() между ними результат будет таким же, как указано выше.
df.filter(pl.col("A", "B").all().is_duplicated()) # Same as above

Unique с сохранением «none» возвращает противоположный результат, который мне хотелось бы, поэтому попробовал следующее:
df.unique(subset=["A", "B"], keep="none").is_not() # 'DataFrame' object has no attribute 'is_not'

Ожидаемый результат — видеть только строки:
shape: (2, 3)
┌─────┬─────┬─────┐
│ A | B | C │
│ --- | --- | --- │
│ i64 | str | i64 │
╞═════╪═════╪═════╡
│ 5 | C | 2 │
│ 5 | C | 1 │
└─────┴─────┴─────┘


Подробнее здесь: https://stackoverflow.com/questions/757 ... -in-polars
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»