У нас есть 3 связанные таблицы: PublicationObject, Source, SourceObjectDetails (которые хранятся в CSV-файлах); Выполняем соединение и получаем набор результатов: Join

Мы хотим создать файл JSON для каждой из этих таблиц (и сохранить эти данные в денормализованной форме) следующим образом:

у нас более 500 объектов публикации, и для каждого заказа на заказ в среднем около 25 столбцов.
поэтому нам нужно создать Json для каждого PublicationObject
Нам нужно сделать это с помощью Python или pyspark (в Azure Databricks)
поделитесь советами и решением, как это сделать