У меня есть csv-файл с неверными значениями (строки вместо целых чисел) в некоторых строках. Чтобы исправить это, я считываю его в поляры и фильтрую кадр данных.
Чтобы иметь возможность прочитать его, мне нужно установить infer_schema_length = 0, поскольку в противном случае чтение завершится неудачно. Однако при этом каждый столбец читается как строка. Как мне повторно определить типы данных/схему исправленного фрейма данных? Я бы хотел избежать настройки каждого столбца по отдельности, так как их много.
К сожалению, я не могу редактировать сам CSV-файл.
Код: Выделить всё
ids_df = pl.read_csv(dataset_path, infer_schema_length=0)
filtered_df = ids_df.filter(~(pl.col("Label") == "Label"))
filtered_df.dtypes
[Utf8,
Utf8,
Utf8,
Utf8,
Utf8,
Utf8,
Utf8,
Utf8,
Utf8,
Utf8,
...
Подробнее здесь: https://stackoverflow.com/questions/774 ... -dataframe