Код: Выделить всё
import polars as pl
df = pl.LazyFrame(
{
"target": [
[1.0, 2.0],
[3.0, 4.0],
],
"point_cloud": [
[
[7.0, 8.0],
[9.0, 10.0],
],
[
[9.0, 10.0],
],
],
},
schema={
"target": pl.Array(pl.Float32, 2),
"point_cloud": pl.List(pl.Array(pl.Float32, 2)),
},
)
Я пытаюсь получить размер облаков точек, например:
Код: Выделить всё
df = (
pl.scan_parquet(dataset).select(size=pl.col("point_cloud").list.len()).collect()
)
Я озадачен, потому что, когда я пытаюсь получить, например. координату x всех целей, все работает нормально (и очень быстро):
Код: Выделить всё
df = pl.scan_parquet(dataset).select(x=pl.col("target").arr.get(0)).collect()
Спасибо
РЕДАКТИРОВАНИЕ
Это график с распределением длины каждого списка (созданный путем запуска одного и того же кода на компьютере с достаточным объемом оперативной памяти для размещения всего набора данных).

Подробнее здесь: https://stackoverflow.com/questions/795 ... ith-polars
Мобильная версия