Мне нужно объединить несколько файлов паркета в Python в один файл паркета. Например, у меня есть 3 файла, как показано ниже:
File1
StudentId StudentName Address1 Address2 Почтовый индекс города
File2
StudentId StudentName MathGrade ScienceGrade HistoryGrade
File3
StudentId StudentName EnglishGrade SpanishGrade
Мне нужно объединить эти файлы по ключевым полям (StudentId и StudentName) и создать один файл, как показано ниже
Выходной файл
StudentId Имя студента Адрес1 Адрес2 Город Почтовый индекс EnglishGrade ИспанскийGrade MathGrade ScienceGrade HistoryGrade
Нужна ваша помощь в этом с помощью pyspark или pandas
Большинство решений, которые я вижу в Интернете, объединяют несколько файлов с одной и той же схемой. Не объединение.
Подробнее здесь: https://stackoverflow.com/questions/791 ... -in-python
Объединение нескольких файлов паркета в один файл в Python ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Запись нулевых значений в файл паркета с помощью Parquet.Net создает нечитаемый файл паркета.
Anonymous » » в форуме C# - 0 Ответы
- 68 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Запись нулевых значений в файл паркета с помощью Parquet.Net создает нечитаемый файл паркета.
Anonymous » » в форуме C# - 0 Ответы
- 22 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как ускорить объединение нескольких листов файлов Excel в один файл Excel
Anonymous » » в форуме Python - 0 Ответы
- 9 Просмотры
-
Последнее сообщение Anonymous
-