Код: Выделить всё
shape: (2, 2)
┌──────┬───────────────┐
│ name ┆ var1_20231229 │
│ --- ┆ --- │
│ str ┆ f64 │
╞══════╪═══════════════╡
│ VW ┆ 0.5 │
│ BMW ┆ 4.0 │
└──────┴───────────────┘
Важно подчеркнуть, как мы планируем наши запросы: чтобы воспользоваться преимуществами распараллеливания, мы группируем все выражения, которые могут выполняться вместе в тот же контекст with_columns. Таким образом, наши запросы будут выглядеть так:
Код: Выделить всё
(df
.with_columns()
.with_columns()
)
Есть ли способ повысить производительность этого процесса? Например, извлекая из каждого списка выражений только те столбцы, которые необходимы для вычисления этого списка выражений.
Подробнее здесь: https://stackoverflow.com/questions/792 ... -dataframe