Я пытаюсь прочитать большой файл Parquet с помощью DuckDB в блокноте Jupyter, работающем в VS Code. Моя цель — запросить подмножество данных непосредственно из файла Parquet, не загружая весь набор данных в память, поскольку моя система имеет ограниченную оперативную память. Однако DuckDB продолжает выдавать исключение IOException, несмотря на то, что путь к файлу правильный и читается с помощью pandas.
Вот базовый код, который я пытался запросить подмножество Файл паркета:
Код: Выделить всё
import duckdb
# Querying a subset of the Parquet file
query = """
SELECT *
FROM '../Data/train.parquet'
WHERE date_id
Подробнее здесь: [url]https://stackoverflow.com/questions/79168406/duckdb-not-reading-parquet-file-despite-correct-path[/url]