Я знаю, что в poalars нет индексов, но мне все равно нужно выполнять специальный поиск данных по этим таблицам, и это достаточно часто, что на это уходит нетривиальный % времени выполнения моего приложения.
В настоящее время я нахожу эти строки с помощью .filter
Код: Выделить всё
def locate(df, entityId, entryDate)->pl.DataFrame:
return df.filter(pl.col('entityId')==entityId).filter(pl.col('entryDate') == entryDate)
Есть ли какие-либо оптимизации, которые мне не хватает?
Некоторые вещи, которые я пробовал:
- использование .lazy / .collect (без изменений)
- сортировка по идентификатору объекта (нет меняй)
Подробнее здесь: https://stackoverflow.com/questions/762 ... -in-polars
Мобильная версия