Мне нужно объединить несколько файлов паркета в Python в один файл паркета. Например, у меня есть 3 файла, как показано ниже:
Файл1
StudentId Имя студента Адрес1 Адрес2 Почтовый индекс города
Файл2
Идентификатор студента Имя учащегося МатематикаОценка НаукаОценка ИсторияОценка
Файл3
StudentId StudentName EnglishGrade SpanishGrade
Мне нужно объединить эти файлы по ключевым полям (StudentId и StudentName) и создать один файл, как показано ниже
Выходной файл
Идентификатор студента Имя учащегося Адрес1 Адрес2 Город Почтовый индекс АнглийскийОценка ИспанскийОценка МатематикаОценка Наука История оценокОценка
Нужны ваши помогите сделать это с помощью pyspark или pandas
Большинство решений, которые я вижу в Интернете, объединяют несколько файлов с одной и той же схемой. Не объединение.
Подробнее здесь: https://stackoverflow.com/questions/791 ... -in-python
Объединение нескольких файлов паркета в один файл в Python ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Запись нулевых значений в файл паркета с помощью Parquet.Net создает нечитаемый файл паркета.
Anonymous » » в форуме C# - 0 Ответы
- 68 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Запись нулевых значений в файл паркета с помощью Parquet.Net создает нечитаемый файл паркета.
Anonymous » » в форуме C# - 0 Ответы
- 23 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как ускорить объединение нескольких листов файлов Excel в один файл Excel
Anonymous » » в форуме Python - 0 Ответы
- 9 Просмотры
-
Последнее сообщение Anonymous
-