Фильтрация выбранных столбцов на основе совокупности столбцовPython

Программы на Python
Ответить
Anonymous
 Фильтрация выбранных столбцов на основе совокупности столбцов

Сообщение Anonymous »

Я хочу выбирать только столбцы с менее чем тремя уникальными значениями. Я могу сгенерировать логическую маску с помощью pl.all().n_unique() < 3, но не знаю, смогу ли я использовать для этого эту маску через API поляров.
В настоящее время я решаю эту проблему с помощью Python. Есть ли более идиоматический способ?
import polars as pl, pandas as pd
df = pl.DataFrame({"col1":[1,1,2], "col2":[1,2,3], "col3":[3,3,3]})
# target is:
# df_few_unique = pl.DataFrame({"col1":[1,1,2], "col3":[3,3,3]})

# my attempt:
mask = df.select(pl.all().n_unique() < 3).to_numpy()[0]
cols = [col for col, m in zip(df.columns, mask) if m]
df_few_unique = df.select(cols)
df_few_unique

Эквивалент в pandas:
df_pandas = df.to_pandas()
mask = (df_pandas.nunique() < 3)
df_pandas.loc[:, mask]


Подробнее здесь: https://stackoverflow.com/questions/734 ... -aggregate
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»