Anonymous
Показать совпадающие строки в полярном соединении
Сообщение
Anonymous » 13 ноя 2025, 13:32
Когда вы объединяете две таблицы, STATA печатает количество объединенных и неслитых строк.
Например, возьмем пример 1 на странице 13 документа по слиянию STATA:
Код: Выделить всё
use https://www.stata-press.com/data/r19/autosize
merge 1:1 make using https://www.stata-press.com/data/r19/autoexpense
напечатает следующую таблицу:
Как я могу получить аналогичный результат с полярами?
Вот отправная точка:
Код: Выделить всё
import polars as pl
autoexpense = pl.DataFrame(
[
pl.Series('make', ['Toyota Celica', 'BMW 320i', 'Cad. Seville', 'Pont. Grand Prix', 'Datsun 210'], dtype=pl.String),
pl.Series('price', [5899, 9735, 15906, 5222, 4589], dtype=pl.Int64),
pl.Series('mpg', [18, 25, 21, 19, 35], dtype=pl.Int64),
]
)
autosize = pl.DataFrame(
[
pl.Series('make', ['Toyota Celica', 'BMW 320i', 'Cad. Seville', 'Pont. Grand Prix', 'Datsun 210', 'Plym. Arrow'], dtype=pl.String),
pl.Series('weight', [2410, 2650, 4290, 3210, 2020, 3260], dtype=pl.Int64),
pl.Series('length', [174, 177, 204, 201, 165, 170], dtype=pl.Int64),
]
)
Кстати, опция слияния pandas в качестве индикатора добавляет столбец к выводу, указывающий источник каждой таблицы.
Подробнее здесь:
https://stackoverflow.com/questions/798 ... olars-join
1763029972
Anonymous
Когда вы объединяете две таблицы, STATA печатает количество объединенных и неслитых строк. Например, возьмем пример 1 на странице 13 документа по слиянию STATA: [code]use https://www.stata-press.com/data/r19/autosize merge 1:1 make using https://www.stata-press.com/data/r19/autoexpense [/code] напечатает следующую таблицу: [img]https://i.sstatic.net/2YKWq4M6.png[/img] Как я могу получить аналогичный результат с полярами? Вот отправная точка: [code]import polars as pl autoexpense = pl.DataFrame( [ pl.Series('make', ['Toyota Celica', 'BMW 320i', 'Cad. Seville', 'Pont. Grand Prix', 'Datsun 210'], dtype=pl.String), pl.Series('price', [5899, 9735, 15906, 5222, 4589], dtype=pl.Int64), pl.Series('mpg', [18, 25, 21, 19, 35], dtype=pl.Int64), ] ) autosize = pl.DataFrame( [ pl.Series('make', ['Toyota Celica', 'BMW 320i', 'Cad. Seville', 'Pont. Grand Prix', 'Datsun 210', 'Plym. Arrow'], dtype=pl.String), pl.Series('weight', [2410, 2650, 4290, 3210, 2020, 3260], dtype=pl.Int64), pl.Series('length', [174, 177, 204, 201, 165, 170], dtype=pl.Int64), ] ) [/code] Кстати, опция слияния pandas в качестве индикатора добавляет столбец к выводу, указывающий источник каждой таблицы. Подробнее здесь: [url]https://stackoverflow.com/questions/79816812/show-matched-rows-in-polars-join[/url]