s3://bucket_name/rs_tables/name='part1'/key='abc'/date=''/part1_0000.parquet
Сканирование этих файлов с помощью Polars
Код: Выделить всё
source = "s3://bucket_name/rs_tables/*/*/*/*.parquet"
storage_options = {
"aws_access_key_id": access_key,
"aws_secret_access_key": secret_key,
"aws_session_token": token
}
lazyFrame = pl.scan_parquet(source, storage_options=storage_options)
lazyFrame.collect()
ComputeError: схема всех файлов в одном scan_parquet должна быть одинаковой.
Есть ли какой-либо вариант mergeSchema, как в Spark? Пожалуйста, предложите варианты решения этой проблемы
Подробнее здесь: https://stackoverflow.com/questions/778 ... ing-polars