Почему Polars pl.read_excel() иногда выдает неизвестную ошибку?Python

Программы на Python
Anonymous
 Почему Polars pl.read_excel() иногда выдает неизвестную ошибку?

Сообщение Anonymous »

polars очень быстро и легко писать. Однако для файлов Excel и CSV с большим количеством строк часто возникает ошибка чтения. Сообщение об ошибке:
Возможно, вы захотите попробовать:
  • увеличить infer_schema_length (например, infer_schema_length=10000),
  • указав правильный тип dtype с помощью Аргумент dtypes
  • установка ignore_errors в значение True,
    Исходная ошибка: оставшиеся байты не пустые
Polars необходимы read_options для read_excel(/csv) файла строк большого размера.

Код: Выделить всё

df = pl.read_excel(file, sheet_name=sheet,
read_options={"infer_schema_length": None})
Я попробовал это и смог прочитать файл данных_excel 23000 строк.
из документа Polars:
https://docs.pola.rs/py-polars/html/ref ... index.html
infer_schema_length : int или None
Максимальное количество строки для сканирования на предмет вывода схемы. Если установлено значение «Нет», можно сканировать все данные (это медленно). Этот параметр применяется только в том случае, если входные данные представляют собой последовательность или генератор строк; другой ввод читается как есть.
https://docs.pola.rs/py-polars/html/ref ... read_excel
Например, {"infer_schema_length": None} можно использовать для считывания данных дважды: один раз для определения правильных типов вывода и еще раз для последующего чтения данные этих типов.

Подробнее здесь: https://stackoverflow.com/questions/778 ... ause-error

Вернуться в «Python»