Код: Выделить всё
import polars as pl
df = (pl.scan_parquet("folder/myfile.parquet")
.filter((pl.col("type")=="Urteil") | (pl.col("type")=="Beschluss"))
.collect()
)
df.head()
Мой код в Pandas :
Код: Выделить всё
import pandas as pd
df = (pd.read_parquet("folder/myfile.parquet")
.query("type == 'Urteil' | type == 'Beschluss'") )
df.head()
i64 < /li>
str < /li>
struct [7] < /li>
str (для всех оставшихся) < /li>
< /ul>
Как уже упоминалось: колонка "content< /code> «хранят большие тексты (от 1 до 20 страниц текста), которые мне нужно для предварительной просчета и хранилище по -разному, я думаю. : удалили размер части исходного поста, так как сравнение не было похоже на подобное и, по -видимому, не связано с моим вопросом.
Подробнее здесь: https://stackoverflow.com/questions/755 ... difference