Пример не может работать, если столбец a или b содержит нулевое значение. (обработка нулевого значения, например, здесь, реальный логический процесс может быть очень сложным)
Код: Выделить всё
df = pl.DataFrame({
"a": [7, 2, 3, 4],
"b": ['2', '5', None, '7'],})
df.with_columns((pl.col('a')+pl.col('b')).alias('sum'))
a
b
sum
i64
str
f64
3
null
null
4
7
11
Мое ожидание:
a
b
sum
i64
str
f64
3
null
3
4
7
11
мое решение:
Код: Выделить всё
def my_sum(x):
x0= x[0] if x[0] is not None else 0
x1= x[1] if float(x[1]) is not None else 0
return x0+x1
df.hstack(df.apply(lambda x:my_sum(x))).rename({"apply": "sum"})
Как заключить в кавычки несколько столбцов в лямбда-функции, используя with_columns, например apply?
Подробнее здесь: https://stackoverflow.com/questions/769 ... th-columns
Мобильная версия