Сумма по столбцам с одинаковым именем (или «ключом») в кадре данных PolarsPython

Программы на Python
Ответить
Anonymous
 Сумма по столбцам с одинаковым именем (или «ключом») в кадре данных Polars

Сообщение Anonymous »

У меня есть этот код

Код: Выделить всё

import polars as pl

pl.DataFrame({
'id': ['CHECK.US1', 'CHECK.US2', 'CHECK.CA9'],
'libor.M2': [99, 332, 934],
'libor.Y5': [11, -10, 904],
'estr.M2':  [99, 271, 741],
'estr.Y3':  [-8, -24, 183],
'estr.Y5':  [88, 771, 455]
})
что дает

Код: Выделить всё

┌───────────┬──────────┬──────────┬─────────┬─────────┬─────────┐
│ id        ┆ libor.M2 ┆ libor.Y5 ┆ estr.M2 ┆ estr.Y3 ┆ estr.Y5 │
│ ---       ┆ ---      ┆ ---      ┆ ---     ┆ ---     ┆ ---     │
│ str       ┆ i64      ┆ i64      ┆ i64     ┆ i64     ┆ i64     │
╞═══════════╪══════════╪══════════╪═════════╪═════════╪═════════╡
│ CHECK.US1 ┆ 99       ┆ 11       ┆ 99      ┆ -8      ┆ 88      │
│ CHECK.US2 ┆ 332      ┆ -10      ┆ 271     ┆ -24     ┆ 771     │
│ CHECK.CA9 ┆ 934      ┆ 904      ┆ 741     ┆ 183     ┆ 455     │
└───────────┴──────────┴──────────┴─────────┴─────────┴─────────┘
Теперь я пытаюсь переименовать столбцы на более короткие имена, например

Код: Выделить всё

┌───────────┬──────┬──────┬─────┬─────┬─────┐
│ id        ┆ M2   ┆ Y5   ┆ M2  ┆ Y3  ┆ Y5  │
│ ---       ┆ ---  ┆ ---  ┆ --- ┆ --- ┆ --- │
│ str       ┆ i64  ┆ i64  ┆ i64 ┆ i64 ┆ i64 │
╞═══════════╪══════╪══════╪═════╪═════╪═════╡
or
┌───────────┬──────┬──────┬─────┬─────┬─────┐
│ id        ┆ libor┆ libor┆ estr┆ estr┆ estr│
│ ---       ┆ ---  ┆ ---  ┆ --- ┆ --- ┆ --- │
│ str       ┆ i64  ┆ i64  ┆ i64 ┆ i64 ┆ i64 │
╞═══════════╪══════╪══════╪═════╪═════╪═════╡
а затем свернуть (= сумму) по столбцам с тем же именем, чтобы получить, например,

Код: Выделить всё

┌───────────┬──────┬──────┬──────┐
│ id        ┆ M2   ┆ Y5   ┆ Y3   │
│ ---       ┆ ---  ┆ ---  ┆ ---  │
│ str       ┆ i64  ┆ i64  ┆ i64  │
╞═══════════╪══════╪══════╪══════╡
│ CHECK.US1 ┆ 198  ┆ 99   ┆ -8   │
│ CHECK.US2 ┆ 603  ┆ 761  ┆ -24  │
│ CHECK.CA9 ┆ 1675 ┆ 1359 ┆ 183  │
└───────────┴──────┴──────┴──────┘
Сначала я попробовал их переименовать, но получил Polars.Exceptions.DuulateError: имя «M2» повторяется.
Есть ли способ добиться того, что я пытаюсь сделать?

редактировать: я также пробовал что-то вроде

Код: Выделить всё

rename_func = lambda col: col.split('.')[-1]
new_cols = set([rename_func(c) for c in df.columns])

df.with_columns([
pl.sum_horizontal(pl.all().map(rename_func) == c).alias(c) for c in new_cols
])
но это не совсем работает.


Подробнее здесь: https://stackoverflow.com/questions/789 ... -dataframe
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»