Код: Выделить всё
df = pl.DataFrame([['1', '1', '1', '1'], ['7', '7', '2', '7'], ['3', '9', '3', '9']])
df
Код: Выделить всё
shape: (4, 3)
┌──────────┬──────────┬──────────┐
│ column_0 ┆ column_1 ┆ column_2 │
│ --- ┆ --- ┆ --- │
│ str ┆ str ┆ str │
╞══════════╪══════════╪══════════╡
│ 1 ┆ 7 ┆ 3 │
│ 1 ┆ 7 ┆ 9 │
│ 1 ┆ 2 ┆ 3 │
│ 1 ┆ 7 ┆ 9 │
└──────────┴──────────┴──────────┘
Код: Выделить всё
df.filter(pl.all().is_duplicated())
Код: Выделить всё
shape: (3, 3)
┌──────────┬──────────┬──────────┐
│ column_0 ┆ column_1 ┆ column_2 │
│ --- ┆ --- ┆ --- │
│ str ┆ str ┆ str │
╞══════════╪══════════╪══════════╡
│ 1 ┆ 7 ┆ 3 │ # DO NOT WANT
│ 1 ┆ 7 ┆ 9 │
│ 1 ┆ 7 ┆ 9 │
└──────────┴──────────┴──────────┘
Логическое индексирование не работает:
Код: Выделить всё
df[df.is_duplicated(), :]
# TypeError: selecting rows by passing a boolean mask to `__getitem__` is not supported
# Hint: Use the `filter` method instead.
- есть ли способ использовать .filter() и выражения для достижения желаемого результата
- какой наиболее эффективный способ достижения желаемого результата
Подробнее здесь: https://stackoverflow.com/questions/721 ... -dataframe
Мобильная версия