Файл df содержит миллионы строк, а столбцов group_by — около 15–20. Есть ли способ ускорить эту операцию?
import polars as pl
import numpy as np
n = 50
df = pl.DataFrame(np.random.randint(0, 100, size=(4, n)), schema=['A', 'B', 'C', 'D'])
x_list = [1,2,3]
pl.concat([df.group_by(['A','B','C']).head(x).with_columns(pl.lit(x).alias('x').cast(pl.Int8)) for x in x_list])
Подробнее здесь: https://stackoverflow.com/questions/793 ... group-afte
Мобильная версия