ComputeError с фреймом данных Polars при попытке объединить выражения в одну операцию with_columns_seqPython

Программы на Python
Ответить
Anonymous
 ComputeError с фреймом данных Polars при попытке объединить выражения в одну операцию with_columns_seq

Сообщение Anonymous »

Я пытаюсь выполнить серию операций с одним столбцом в DataFrame с отложенной полярностью и стараюсь избежать повторного использования with_columns_seq при этом, но появляется ComputeError, указывающий повторяющееся имя столбца. Есть ли лучшая альтернатива этому?

Код: Выделить всё

df = (
df
.with_columns_seq([
pl.col('sentiment').cast(pl.UInt8),
pl.col('review').map_elements(lambda x: BeautifulSoup(x).get_text()),
pl.col('review').str.replace(r"[^a-zA-Z0-9]", " "),
pl.col('review').str.to_lowercase(),
# pl.col('review').str.split_by(' ')
])

)

df.collect().head()
и ошибка

Код: Выделить всё

ComputeError: the name: 'review' passed to `LazyFrame.with_columns` is duplicate

It's possible that multiple expressions are returning the same default column name. If this is the case, try renaming the columns with `.alias("new_name")` to avoid duplicate column names.
пытался скомпоновать все операции, но не удалось из-за ошибки дублирования столбца

Подробнее здесь: https://stackoverflow.com/questions/781 ... n-a-single
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»