Полярные значения: замените значение в столбце менее чем X уникальными значениями на другое конкретное значение.Python

Программы на Python
Ответить
Anonymous
 Полярные значения: замените значение в столбце менее чем X уникальными значениями на другое конкретное значение.

Сообщение Anonymous »

Я пытаюсь переписать конвейер pandas, используя поляры. У меня есть столбцы с множеством уникальных категорий, я хочу заменить все категории, количество вхождений которых меньше X, определенным значением (в этом случае заменить категории, которые появляются менее 50 раз, строкой «другое»)
  • pandas:

Код: Выделить всё

uniques = df["a"].value_counts()
df.loc[~df["a"].isin(uniques[uniques > 50].index), "a"] = "other"
  • Моя попытка с полярами:

Код: Выделить всё

df = df.with_columns(pl.when(pl.col("a").unique_counts() < 50).then("other").otherwise(pl.col("a")).alias("a"))
Я попробовал несколько вариантов этого кода, но получил либо ошибку, либо результат, которого не ожидал.
Я нигде не нашел ничего об этом конкретном варианте использования.
Спасибо.>

Подробнее здесь: https://stackoverflow.com/questions/760 ... ferent-spe
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»