У меня вопрос о том, как лучше всего преобразовать этот JSON в Dataframe:
Данные JSON:
{
"myschema": {
"accounts": {
"load_type": "daily",
"fields": {
"id": "nvarchar2",
"isdeleted": "number",
"master": "nvarchar2",
"name": "nvarchar2"
}
},
"customer": {
"load_type": "daily",
"fields": {
"id": "nvarchar2",
"accountid": "nvarchar2",
"usergroupid": "nvarchar2"
}
},
"resources": {
"load_type": "daily",
"fields": {
"id": "nvarchar2",
"isdeleted": "number",
"name": "nvarchar2",
"currency": "nvarchar2"
}
},
....
....
}
}
Результат должен быть примерно таким:
TABLE |LOAD_TYPE |COLUMN |COLUMN_TYPE |
+-----------+-----------+-----------------+--------------+
| accounts |daily |id |NVARCHAR2 |
| accounts |daily |master |NVARCHAR2 |
| accounts |daily |name |NVARCHAR2 |
| customer |daily |id |NVARCHAR2 |
| customer |daily |accountid |NVARCHAR2 |
| customer |daily |usergroupid |NVARCHAR2 |
| resources |daily |id |NVARCHAR2 |
| resources |daily |name |NVARCHAR2 |
| resources |daily |currency |NVARCHAR2 |
+-----------+-----------+-----------------+--------------+
Я попробовал следующий код:
df2 = spark.read.option("multiLine", "true").json(json_s3_path)
df2.printSchema()
root
|-- mySchema: struct (nullable = true)
| |-- accounts: struct (nullable = true)
| | |-- FIELDS: struct (nullable = true)
.....
.....
а также следующий код:
df3 = spark.read.format("json") \
.option("multiLine", True) \
.option("header",True) \
.option("inferschema",True) \
.load(json_s3_path) \
и результат:
+----------------------------------------------------------------------------------------------------------------------------------------------------+
|mySchema |
+----------------------------------------------------------------------------------------------------------------------------------------------------+
|{{{NVARCHAR2, NUMBER, NVARCHAR2, NVARCHAR2}, Delta}, {{NVARCHAR2, NVARCHAR2, NVARCHAR2}, Delta}, {{NVARCHAR2, NVARCHAR2, NUMBER, NVARCHAR2}, Delta}}|
+----------------------------------------------------------------------------------------------------------------------------------------------------+
Подробнее здесь: https://stackoverflow.com/questions/790 ... -dataframe
Какой лучший способ конвертировать JSON в фрейм данных? [закрыто] ⇐ Python
Программы на Python
-
Anonymous
1730888992
Anonymous
У меня вопрос о том, как лучше всего преобразовать этот JSON в Dataframe:
Данные JSON:
{
"myschema": {
"accounts": {
"load_type": "daily",
"fields": {
"id": "nvarchar2",
"isdeleted": "number",
"master": "nvarchar2",
"name": "nvarchar2"
}
},
"customer": {
"load_type": "daily",
"fields": {
"id": "nvarchar2",
"accountid": "nvarchar2",
"usergroupid": "nvarchar2"
}
},
"resources": {
"load_type": "daily",
"fields": {
"id": "nvarchar2",
"isdeleted": "number",
"name": "nvarchar2",
"currency": "nvarchar2"
}
},
....
....
}
}
Результат должен быть примерно таким:
TABLE |LOAD_TYPE |COLUMN |COLUMN_TYPE |
+-----------+-----------+-----------------+--------------+
| accounts |daily |id |NVARCHAR2 |
| accounts |daily |master |NVARCHAR2 |
| accounts |daily |name |NVARCHAR2 |
| customer |daily |id |NVARCHAR2 |
| customer |daily |accountid |NVARCHAR2 |
| customer |daily |usergroupid |NVARCHAR2 |
| resources |daily |id |NVARCHAR2 |
| resources |daily |name |NVARCHAR2 |
| resources |daily |currency |NVARCHAR2 |
+-----------+-----------+-----------------+--------------+
Я попробовал следующий код:
df2 = spark.read.option("multiLine", "true").json(json_s3_path)
df2.printSchema()
root
|-- mySchema: struct (nullable = true)
| |-- accounts: struct (nullable = true)
| | |-- FIELDS: struct (nullable = true)
.....
.....
а также следующий код:
df3 = spark.read.format("json") \
.option("multiLine", True) \
.option("header",True) \
.option("inferschema",True) \
.load(json_s3_path) \
и результат:
+----------------------------------------------------------------------------------------------------------------------------------------------------+
|mySchema |
+----------------------------------------------------------------------------------------------------------------------------------------------------+
|{{{NVARCHAR2, NUMBER, NVARCHAR2, NVARCHAR2}, Delta}, {{NVARCHAR2, NVARCHAR2, NVARCHAR2}, Delta}, {{NVARCHAR2, NVARCHAR2, NUMBER, NVARCHAR2}, Delta}}|
+----------------------------------------------------------------------------------------------------------------------------------------------------+
Подробнее здесь: [url]https://stackoverflow.com/questions/79025101/which-is-the-best-way-to-convert-json-into-a-dataframe[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия