Как я могу заполнить столбец списка в кадре данных Polars, используя размер, указанный в другом столбце? - Цифровое Кемерово

Как я могу заполнить столбец списка в кадре данных Polars, используя размер, указанный в другом столбце? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как я могу заполнить столбец списка в кадре данных Polars, используя размер, указанный в другом столбце?

Цитата

Сообщение Anonymous » 03 ноя 2025, 13:29

У меня есть два столбца в кадре данных: Pad_size и Pad_start:

Код: Выделить всё

import polars as pl

# Increase repr defaults
pl.Config(fmt_table_cell_list_len=6, fmt_str_lengths=100)

# Example Polars DataFrame with arrays pad_start and pad_size
data = {
'pad_size': [5, 4, 3],
'pad_start': [[1, 2], [4, 5, 6], [7]]
}
df = pl.DataFrame(data)

Код: Выделить всё

┌──────────┬───────────┐
│ pad_size ┆ pad_start │
│ ---      ┆ ---       │
│ i64      ┆ list[i64] │
╞══════════╪═══════════╡
│ 5        ┆ [1, 2]    │
│ 4        ┆ [4, 5, 6] │
│ 3        ┆ [7]       │
└──────────┴───────────┘

Я хотел бы вывести другой столбец, Pad_end, где Pad_end = Pad_start + добавлять 0 с до тех пор, пока длина Pad_end = Pad_size
Желаемый результат:

Код: Выделить всё

data = {
'pad_size': [5, 4, 3],
'pad_start': [[1, 2, 0, 0, 0], [4, 5, 6, 0], [7, 0, 0]]
}
expected = pl.DataFrame(data)

Код: Выделить всё

┌──────────┬─────────────────┐
│ pad_size ┆ pad_start       │
│ ---      ┆ ---             │
│ i64      ┆ list[i64]       │
╞══════════╪═════════════════╡
│ 5        ┆ [1, 2, 0, 0, 0] │
│ 4        ┆ [4, 5, 6, 0]    │
│ 3        ┆ [7, 0, 0]       │
└──────────┴─────────────────┘

Я использую Polars 0.18.4 из-за некоторых ограничений.
Я пробовал использовать различные функции списков, и самое близкое, что у меня получилось, это объединить кучу нулей, а затем разрезать их, но это, похоже, не очень хорошо масштабируется (работает только для определенного диапазона Pad_size)
Наилучшее на данный момент решение

Код: Выделить всё

df_int = df.with_columns(zero = pl.lit(0)).with_columns(pl.col('zero').repeat_by(pl.col('pad_size') - pl.col('pad_start').list.lengths()))

df_int.with_columns(
pl.col('pad_start').list.concat(pl.col('zero')).alias('pad_end')
)

создаст столбецpad_end вместе с нулевым столбцом, что добавит необходимое количество [0]

Подробнее здесь: https://stackoverflow.com/questions/787 ... ated-in-an

1762165797

Anonymous

У меня есть два столбца в кадре данных: Pad_size и Pad_start:
[code]import polars as pl

# Increase repr defaults
pl.Config(fmt_table_cell_list_len=6, fmt_str_lengths=100)

# Example Polars DataFrame with arrays pad_start and pad_size
data = {
'pad_size': [5, 4, 3],
'pad_start': [[1, 2], [4, 5, 6], [7]]
}
df = pl.DataFrame(data)
[/code]
[code]┌──────────┬───────────┐
│ pad_size ┆ pad_start │
│ ---      ┆ ---       │
│ i64      ┆ list[i64] │
╞══════════╪═══════════╡
│ 5        ┆ [1, 2]    │
│ 4        ┆ [4, 5, 6] │
│ 3        ┆ [7]       │
└──────────┴───────────┘
[/code]
Я хотел бы вывести другой столбец, Pad_end, где Pad_end = Pad_start + добавлять 0 с до тех пор, пока длина Pad_end = Pad_size
Желаемый результат:
[code]data = {
'pad_size': [5, 4, 3],
'pad_start': [[1, 2, 0, 0, 0], [4, 5, 6, 0], [7, 0, 0]]
}
expected = pl.DataFrame(data)
[/code]
[code]┌──────────┬─────────────────┐
│ pad_size ┆ pad_start       │
│ ---      ┆ ---             │
│ i64      ┆ list[i64]       │
╞══════════╪═════════════════╡
│ 5        ┆ [1, 2, 0, 0, 0] │
│ 4        ┆ [4, 5, 6, 0]    │
│ 3        ┆ [7, 0, 0]       │
└──────────┴─────────────────┘
[/code]
Я использую Polars 0.18.4 из-за некоторых ограничений.
Я пробовал использовать различные функции списков, и самое близкое, что у меня получилось, это объединить кучу нулей, а затем разрезать их, но это, похоже, не очень хорошо масштабируется (работает только для определенного диапазона Pad_size)
Наилучшее на данный момент решение
[code]df_int = df.with_columns(zero = pl.lit(0)).with_columns(pl.col('zero').repeat_by(pl.col('pad_size') - pl.col('pad_start').list.lengths()))

df_int.with_columns(
pl.col('pad_start').list.concat(pl.col('zero')).alias('pad_end')
)
[/code]
создаст столбецpad_end вместе с нулевым столбцом, что добавит необходимое количество [0]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78729054/how-can-i-pad-a-list-column-in-a-polars-dataframe-using-the-size-indicated-in-an[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»