Код: Выделить всё
(
pl.scan_parquet('data/data-16828*.parquet')
.groupby(['type_id', 'location_id'])
.agg([
pl.min('n').alias('n_min'),
pl.max('n').alias('n_max')
])
.collect()
)
На мой взгляд, мне, вероятно, следует добавить новый столбец и заполнить его значениями date значение первой строки для каждого файла. Можно ли добиться этого с помощью ленивого API Polars, или мне придется сначала исправить файлы, прежде чем запускать агрегацию с помощью Polars?
Обратите внимание, что мне нужно использовать ленивый API как набор данных намного больше памяти.
Подробнее здесь: https://stackoverflow.com/questions/763 ... ltiple-par