Почему Polars pl.read_excel() иногда выдает неизвестную ошибку? - Цифровое Кемерово

Почему Polars pl.read_excel() иногда выдает неизвестную ошибку? ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Почему Polars pl.read_excel() иногда выдает неизвестную ошибку?

Сообщение Anonymous » 26 окт 2025, 17:02

polars очень быстро и легко писать. Однако для файлов Excel и CSV с большим количеством строк часто возникает ошибка чтения. Сообщение об ошибке:
Возможно, вы захотите попробовать:

увеличить infer_schema_length (например, infer_schema_length=10000),
указав правильный тип dtype с помощью Аргумент dtypes
установка ignore_errors в значение True,
Исходная ошибка: оставшиеся байты не пустые

Polars необходимы read_options для read_excel(/csv) файла строк большого размера.

Код: Выделить всё

df = pl.read_excel(file, sheet_name=sheet,
read_options={"infer_schema_length": None})

Я попробовал это и смог прочитать файл данных_excel 23000 строк.
из документа Polars:
https://docs.pola.rs/py-polars/html/ref ... index.html
infer_schema_length : int или None
Максимальное количество строки для сканирования на предмет вывода схемы. Если установлено значение «Нет», можно сканировать все данные (это медленно). Этот параметр применяется только в том случае, если входные данные представляют собой последовательность или генератор строк; другой ввод читается как есть.
https://docs.pola.rs/py-polars/html/ref ... read_excel
Например, {"infer_schema_length": None} можно использовать для считывания данных дважды: один раз для определения правильных типов вывода и еще раз для последующего чтения данные этих типов.

Подробнее здесь: https://stackoverflow.com/questions/778 ... ause-error

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «Python»