Как фильтровать дубликаты на основе нескольких столбцов в Polars? [дубликат]Python

Программы на Python
Ответить
Anonymous
 Как фильтровать дубликаты на основе нескольких столбцов в Polars? [дубликат]

Сообщение Anonymous »

Раньше мне удавалось фильтровать дубликаты на основе нескольких столбцов с помощью df.filter(pl.col(['A','C']).is_duulated()), но после обновления последней версии это не работает.
import polars as pl

df = pl.DataFrame(
{
"A": [1,4,4,7,7,10,10,13,16],
"B": [2,5,5,8,18,11,11,14,17],
"C": [3,6,6,9,9,12,12,15,18]
}
)

Обе попытки приводят к ошибке:
df.filter(pl.col(['A','C']).is_duplicated())
# ComputeError: The predicate passed to 'LazyFrame.filter' expanded to multiple expression

df.filter(
df.select(pl.col(['A','C']).is_duplicated())
)
# TypeError: invalid predicate for `filter`


Подробнее здесь: https://stackoverflow.com/questions/770 ... -in-polars
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»