Код: Выделить всё
import polars as pl
lf = pl.scan_parquet("data.parquet")
lf.filter(pl.col("URI") == "").collect()
Код: Выделить всё
shape: (0, 3)
┌─────┬────────┬───────────┐
│ URI ┆ REMARK ┆ TIMESTAMP │
│ --- ┆ --- ┆ --- │
│ str ┆ str ┆ i64 │
╞═════╪════════╪═══════════╡
└─────┴────────┴───────────┘
Код: Выделить всё
lf.filter(pl.col("REMARK") == "NO URI").collect()
Код: Выделить всё
shape: (7_767, 3)
┌─────┬────────┬────────────┐
│ URI ┆ REMARK ┆ TIMESTAMP │
│ --- ┆ --- ┆ --- │
│ str ┆ str ┆ i64 │
╞═════╪════════╪════════════╡
│ ┆ NO URI ┆ 1759257000 │
│ ┆ NO URI ┆ 1759257000 │
│ ┆ NO URI ┆ 1759257000 │
│ ┆ NO URI ┆ 1759257000 │
│ ┆ NO URI ┆ 1759257000 │
│ … ┆ … ┆ … │
│ ┆ NO URI ┆ 1759257000 │
│ ┆ NO URI ┆ 1759257000 │
│ ┆ NO URI ┆ 1759257000 │
│ ┆ NO URI ┆ 1759257000 │
│ ┆ NO URI ┆ 1759257000 │
└─────┴────────┴────────────┘
Код: Выделить всё
len(lf.filter(pl.col("REMARK") == "NO URI").collect()["URI"][0]) # Outputs 0
Версия Python: 3.14.2
Версия Polars: 1.35.2
Подробнее здесь: https://stackoverflow.com/questions/798 ... -lazyframe
Мобильная версия