Как выбрать строки по пользовательскому индексу после фильтрации в Polars, аналогично .loc в Pandas? - Цифровое Кемерово

Как выбрать строки по пользовательскому индексу после фильтрации в Polars, аналогично .loc в Pandas? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как выбрать строки по пользовательскому индексу после фильтрации в Polars, аналогично .loc в Pandas?

Цитата

Сообщение Anonymous » 30 окт 2025, 14:16

В Pandas после фильтрации/сортировки DataFrame индексы строк могут стать непоследовательными (например, [0, 10, 4]). Если я использую .loc[10], я могу получить строку, соответствующую исходному индексу 10, из DataFrame, которая теперь является второй строкой в отфильтрованном/отсортированном DataFrame:

Код: Выделить всё

import polars as pl

df = pl.DataFrame({"A": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]})

df_pd = df.to_pandas()
filtered_df = df_pd.loc[[0, 10, 4]]

# Retrieves the row where the original index is 4
print(filtered_df.loc[4])

Это выведет:

Код: Выделить всё

A    4
Name: 4, dtype: int64

Я пытаюсь воспроизвести это поведение в Polars. Чтобы сохранить исходные индексы строк после фильтрации, я создал столбец индекса с помощью .with_row_index(). Однако я не уверен, как действовать дальше. Мне нужно эффективное решение, которое позволит мне использовать аналогичную функциональность .loc для выбора нескольких строк по их исходным индексам в Polars после фильтрации или сортировки.

Подробнее здесь: https://stackoverflow.com/questions/789 ... -to-loc-in

1761823005

Anonymous

В Pandas после фильтрации/сортировки DataFrame индексы строк могут стать непоследовательными (например, [0, 10, 4]). Если я использую .loc[10], я могу получить строку, соответствующую исходному индексу 10, из DataFrame, которая теперь является второй строкой в отфильтрованном/отсортированном DataFrame:
[code]import polars as pl

df = pl.DataFrame({"A": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]})

df_pd = df.to_pandas()
filtered_df = df_pd.loc[[0, 10, 4]]

# Retrieves the row where the original index is 4
print(filtered_df.loc[4])
[/code]
Это выведет:
[code]A    4
Name: 4, dtype: int64
[/code]
Я пытаюсь воспроизвести это поведение в Polars. Чтобы сохранить исходные индексы строк после фильтрации, я создал столбец индекса с помощью .with_row_index(). Однако я не уверен, как действовать дальше. Мне нужно эффективное решение, которое позволит мне использовать аналогичную функциональность .loc для выбора нескольких строк по их исходным индексам в Polars после фильтрации или сортировки. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78929750/how-to-select-rows-by-custom-index-after-filtering-in-polars-similar-to-loc-in[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»