Код: Выделить всё
import polars as pl
# Increase repr defaults
pl.Config(fmt_table_cell_list_len=6, fmt_str_lengths=100)
# Example Polars DataFrame with arrays pad_start and pad_size
data = {
'pad_size': [5, 4, 3],
'pad_start': [[1, 2], [4, 5, 6], [7]]
}
df = pl.DataFrame(data)
Код: Выделить всё
┌──────────┬───────────┐
│ pad_size ┆ pad_start │
│ --- ┆ --- │
│ i64 ┆ list[i64] │
╞══════════╪═══════════╡
│ 5 ┆ [1, 2] │
│ 4 ┆ [4, 5, 6] │
│ 3 ┆ [7] │
└──────────┴───────────┘
Желаемый результат:
Код: Выделить всё
data = {
'pad_size': [5, 4, 3],
'pad_start': [[1, 2, 0, 0, 0], [4, 5, 6, 0], [7, 0, 0]]
}
expected = pl.DataFrame(data)
Код: Выделить всё
┌──────────┬─────────────────┐
│ pad_size ┆ pad_start │
│ --- ┆ --- │
│ i64 ┆ list[i64] │
╞══════════╪═════════════════╡
│ 5 ┆ [1, 2, 0, 0, 0] │
│ 4 ┆ [4, 5, 6, 0] │
│ 3 ┆ [7, 0, 0] │
└──────────┴─────────────────┘
Я пробовал использовать различные функции списков, и самое близкое, что у меня получилось, это объединить кучу нулей, а затем разрезать их, но это, похоже, не очень хорошо масштабируется (работает только для определенного диапазона Pad_size)
Наилучшее на данный момент решение
Код: Выделить всё
df_int = df.with_columns(zero = pl.lit(0)).with_columns(pl.col('zero').repeat_by(pl.col('pad_size') - pl.col('pad_start').list.lengths()))
df_int.with_columns(
pl.col('pad_start').list.concat(pl.col('zero')).alias('pad_end')
)
Подробнее здесь: https://stackoverflow.com/questions/787 ... ated-in-an
Мобильная версия