В Pandas после фильтрации/сортировки DataFrame индексы строк могут стать непоследовательными (например, [0, 10, 4]). Если я использую .loc[10], я могу получить строку, соответствующую исходному индексу 10, из DataFrame, которая теперь является второй строкой в отфильтрованном/отсортированном DataFrame:
Код: Выделить всё
import polars as pl
df = pl.DataFrame({"A": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]})
df_pd = df.to_pandas()
filtered_df = df_pd.loc[[0, 10, 4]]
# Retrieves the row where the original index is 4
print(filtered_df.loc[4])
Это выведет:
Я пытаюсь воспроизвести это поведение в Polars. Чтобы сохранить исходные индексы строк после фильтрации, я создал столбец индекса с помощью .with_row_index(). Однако я не уверен, как действовать дальше. Мне нужно эффективное решение, которое позволит мне использовать аналогичную функциональность .loc для выбора нескольких строк по их исходным индексам в Polars после фильтрации или сортировки.
Подробнее здесь:
https://stackoverflow.com/questions/789 ... -to-loc-in