Код: Выделить всё
psycopg2.errors.BadCopyFileFormat: extra data after last expected column
Код: Выделить всё
"
Код: Выделить всё
,
Код: Выделить всё
/
Код: Выделить всё
df_ops.df.repartition(num_partitions).write.mode("overwrite").format("csv").option("header", "false").save(file_path)
query = f"""COPY {table_name} ({column_string}) FROM STDIN WITH (FORMAT CSV, HEADER FALSE, DELIMITER ',', NULL '');"""
Исходная строка:
Код: Выделить всё
2024-07-18 12:09:28,2012420012080452979,60,V2,"Suspected fraud, decline / Transactions declined based on Risk Score",1
Код: Выделить всё
2024-07-18 12:09:28,2012420012080452979,60,V2,"\"Suspected fraud, decline / Transactions declined based on Risk Score\"",1
- Мои данные содержат смесь специальных символов, запятых и двойных кавычек.
- Команда COPY в PostgreSQL выдает ошибку при обработке CSV из-за этих специальных символов.
Как я могу гарантировать, что вывод CSV из Spark правильно отформатирован для обработки всех специальных символов (двойных кавычек, запятых, косой черты и т. д.) при использовании команды PostgreSQL COPY ? Должен ли я настроить параметры записи Spark или оператор PostgreSQL COPY, чтобы справиться с этим?
Любые рекомендации о том, как обрабатывать эти escape-последовательности и обеспечивать обработку команд COPY были бы очень признательны за правильность данных.
Подробнее здесь: https://stackoverflow.com/questions/790 ... -postgresq