Прежде чем увеличить емкость сервера, мы хотели бы знать, может ли Polars загружать файлы такой формы или есть ли любой трюк, чтобы заставить его работать (например, разрезать файлы JSON на куски или более мелкие наборы данных). Мы пробовали использовать отложенный API, но результат тот же.
Использовались следующие версии:
- Python 3.12
- Polars 1.7.0
Код: Выделить всё
import polars as pl
file_path = "file.json"
lazy_frame = pl.LazyFrame
lazy_frame = pl.scan_ndjson(file_path, infer_schema_length=None)
selected_columns = [
'field1', 'field2', 'field3', 'field4',
'field5', 'field6', 'field7', 'field8'
]
result = lazy_frame.select([pl.col(col) for col in selected_columns])
df = result.collect(streaming=True)
print(df.shape)
С уважением
Подробнее здесь: https://stackoverflow.com/questions/793 ... -json-file
Мобильная версия