Левое соединение двух столбцов взорванных поляров

Левое соединение двух столбцов взорванных поляров ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Левое соединение двух столбцов взорванных поляров

Цитата

Сообщение Anonymous » 04 ноя 2025, 22:17

Принимая во внимание

Код: Выделить всё

import polars as pl

df = pl.DataFrame({
"a": [[1, 2], [3]],
"b": [
[{"id": 1, "x": 1}, {"id": 3, "x": 3}],
[{"id": 3, "x": 4}]
]
})

Код: Выделить всё

┌───────────┬─────────────────┐
│ a         ┆ b               │
│ ---       ┆ ---             │
│ list[i64] ┆ list[struct[2]] │
╞═══════════╪═════════════════╡
│ [1, 2]    ┆ [{1,1}, {3,3}]  │
│ [3]       ┆ [{3,4}]         │
└───────────┴─────────────────┘

Как

получить одну строку для каждого выравнивающего элемента a и
если список dict в b содержит элемент a в качестве идентификатора
тогда иметь соответствующее значение x в столбце b
в противном случае b должно быть null

Текущий подход

Код: Выделить всё

.explode

оба a и b и .filter (ВНУТРЕННЕЕ СОЕДИНЕНИЕ):

Код: Выделить всё

df.explode("a").explode("b").filter(
pl.col("a") == pl.col("b").struct.field("id")
).select(
pl.col("a"),
pl.col("b").struct.field("x").alias("b")
)

К сожалению, я получаю только (ожидаемое):

Код: Выделить всё

┌─────┬─────┐
│ a   ┆ b   │
│ --- ┆ --- │
│ i64 ┆ i64 │
╞═════╪═════╡
│ 1   ┆ 1   │
│ 3   ┆ 4   │
└─────┴─────┘

Вместо полного «LEFT JOIN» я стремлюсь:

Код: Выделить всё

┌─────┬──────┐
│ a   ┆ b    │
│ --- ┆ ---  │
│ i64 ┆ i64  │
╞═════╪══════╡
│ 1   ┆ 1    │
│ 2   ┆ null │
│ 3   ┆ 4    │
└─────┴──────┘

Как эффективно получить желаемый результат, если DataFrame имеет такую структуру?

Подробнее здесь: https://stackoverflow.com/questions/780 ... rs-columns

1762283852

Anonymous

[h4]Принимая во внимание[/h4]
[code]import polars as pl

df = pl.DataFrame({
"a": [[1, 2], [3]],
"b": [
[{"id": 1, "x": 1}, {"id": 3, "x": 3}],
[{"id": 3, "x": 4}]
]
})
[/code]
[code]┌───────────┬─────────────────┐
│ a         ┆ b               │
│ ---       ┆ ---             │
│ list[i64] ┆ list[struct[2]] │
╞═══════════╪═════════════════╡
│ [1, 2]    ┆ [{1,1}, {3,3}]  │
│ [3]       ┆ [{3,4}]         │
└───────────┴─────────────────┘
[/code]
[h4]Как[/h4]
[list]
[*]получить одну строку для каждого выравнивающего элемента a и
[*]если список dict в b содержит элемент a в качестве идентификатора
[*]тогда иметь соответствующее значение x в столбце b
[*]в противном случае b должно быть null
[/list]

[h4]Текущий подход[/h4]
[code].explode[/code] оба a и b и .filter (ВНУТРЕННЕЕ СОЕДИНЕНИЕ):
[code]df.explode("a").explode("b").filter(
pl.col("a") == pl.col("b").struct.field("id")
).select(
pl.col("a"),
pl.col("b").struct.field("x").alias("b")
)
[/code]
К сожалению, я получаю только (ожидаемое):
[code]┌─────┬─────┐
│ a   ┆ b   │
│ --- ┆ --- │
│ i64 ┆ i64 │
╞═════╪═════╡
│ 1   ┆ 1   │
│ 3   ┆ 4   │
└─────┴─────┘
[/code]
Вместо полного «LEFT JOIN» я стремлюсь:
[code]┌─────┬──────┐
│ a   ┆ b    │
│ --- ┆ ---  │
│ i64 ┆ i64  │
╞═════╪══════╡
│ 1   ┆ 1    │
│ 2   ┆ null │
│ 3   ┆ 4    │
└─────┴──────┘
[/code]
Как эффективно получить желаемый результат, если DataFrame имеет такую структуру? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78041738/left-join-of-2-exploded-polars-columns[/url]