DuckDB не читает файл Parquet, несмотря на правильный путь

DuckDB не читает файл Parquet, несмотря на правильный путь ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

DuckDB не читает файл Parquet, несмотря на правильный путь

Цитата

Сообщение Anonymous » 08 ноя 2024, 02:43

Я пытаюсь прочитать большой файл Parquet с помощью DuckDB в блокноте Jupyter, работающем в VS Code. Моя цель — запросить подмножество данных непосредственно из файла Parquet, не загружая весь набор данных в память, поскольку моя система имеет ограниченную оперативную память. Однако DuckDB продолжает выдавать исключение IOException, несмотря на то, что путь к файлу правильный и читается с помощью pandas.
Вот базовый код, который я пытался запросить подмножество Файл паркета:

Код: Выделить всё

import duckdb

# Querying a subset of the Parquet file
query = """
SELECT *
FROM '../Data/train.parquet'
WHERE date_id 

Подробнее здесь: [url]https://stackoverflow.com/questions/79168406/duckdb-not-reading-parquet-file-despite-correct-path[/url]

1731023033

Anonymous

Я пытаюсь прочитать большой файл Parquet с помощью DuckDB в блокноте Jupyter, работающем в VS Code. Моя цель — запросить подмножество данных непосредственно из файла Parquet, не загружая весь набор данных в память, поскольку моя система имеет ограниченную оперативную память. Однако DuckDB продолжает выдавать исключение IOException, несмотря на то, что путь к файлу правильный и читается с помощью pandas.
Вот базовый код, который я пытался запросить подмножество Файл паркета:
[code]import duckdb

# Querying a subset of the Parquet file
query = """
SELECT *
FROM '../Data/train.parquet'
WHERE date_id 

Подробнее здесь: [url]https://stackoverflow.com/questions/79168406/duckdb-not-reading-parquet-file-despite-correct-path[/url]