Как сгладить вложенный json в pyspark

Как сгладить вложенный json в pyspark ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как сгладить вложенный json в pyspark

Цитата

Сообщение Anonymous » 12 мар 2025, 11:59

У меня есть файл json, который выглядит так: < /p>

Код: Выделить всё

[
{  "student_id": 1234,
"room_id": "abc",
"enrolled": false
},
{   "student_id": 4321,
"room_id": "def",
"enrolled": true,
"enrollment": {
"type": "home",
"date": "01-01-2020"
}
},
{   "student_id": 678,
"room_id": "htf",
"sports": {
"team": "hockey",
"position": "forward"
}
]
< /code>
Я могу частично его сгладить, выполнив: < /p>
df = sc.parallelize(data).map(lambda x: json.dumps(x))

This gives me:

student_id
room_id
enrolled
enrollment
sports

1234
abc
false
NULL
null < /td>
< /tr>

4321 < /td>
def < /td>
true < /td>
{Home, 01-01-2020} < /td>
{Home, 01-01-2020} < /td>
{Home, 01-01-2020} /> < /tr>

678 < /td>
htf < /td>
null < /td>
null < /td>
{hockey, strival} < /td>
/>
How can I flatten this further to get:

student_id
room_id
enrolled
type < /th>
date < /th>
team < /th>
position < /th>
< /tr>
< /thead>

1234 < /td>

1234 < /td>

/> false < /td>
null < /td>
null < /td>
null < /td>
null < /td>
< /tr>

4321 < /td>

4321 < /td> /> def < /td>
true < /td>
home < /td>
01-01-2020 < /td>
null < /td>
null < /td>
< /tr>

null < /td>
< /tr>
678 < /td>
htf < /td>
null < /td>
null < /td>
функциональный />

Подробнее здесь: https://stackoverflow.com/questions/794 ... in-pyspark

1741769955

Anonymous

 У меня есть файл json, который выглядит так: < /p>
[code][
{  "student_id": 1234,
"room_id": "abc",
"enrolled": false
},
{   "student_id": 4321,
"room_id": "def",
"enrolled": true,
"enrollment": {
"type": "home",
"date": "01-01-2020"
}
},
{   "student_id": 678,
"room_id": "htf",
"sports": {
"team": "hockey",
"position": "forward"
}
]
< /code>
Я могу частично его сгладить, выполнив: < /p>
df = sc.parallelize(data).map(lambda x: json.dumps(x))
[/code]
This gives me:



student_id
room_id
enrolled
enrollment
sports




1234
abc
false
NULL
 null < /td>
< /tr>

 4321 < /td>
 def < /td>
 true < /td>
 {Home, 01-01-2020} < /td>
 {Home, 01-01-2020} < /td>
 {Home, 01-01-2020} /> < /tr>

 678 < /td>
 htf < /td>
 null < /td>
 null < /td>
 {hockey, strival} < /td>
       />
How can I flatten this further to get:



student_id
room_id
enrolled
 type < /th>
 date < /th>
 team < /th>
 position < /th>
< /tr>
< /thead>


 1234 < /td>
 
 1234 < /td>
 
 />  false < /td>
 null < /td>
 null < /td>
 null < /td>
 null < /td>
< /tr>

 4321 < /td>

 4321 < /td> />  def < /td>
 true < /td>
 home < /td>
 01-01-2020 < /td>
 null < /td>
 null < /td>
< /tr>

 null < /td>
< /tr>
 678 < /td>
 htf < /td>
 null < /td>
 null < /td>
функциональный /> 
  

Подробнее здесь: [url]https://stackoverflow.com/questions/79487830/how-to-flatten-nested-json-in-pyspark[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Попытка сгладить приведенный ниже JSON, неспособный сделать это, пожалуйста, нужна помощь, чтобы сгладить вложенного JSO

Последнее сообщение Anonymous « 04 июл 2025, 14:52
Добавлено в форуме Python

Anonymous » 04 июл 2025, 14:52 » в форуме Python

import pandas as pd

data =''' [
{
ANA_TY : ay_type ,
ANA_SUB_TY : sub_type ,
DAG_ID : dagid1234 ,
PARAMETERS : {
char : [],
cp : cp ,
area : ,
YEAR : ,
id : 12345 ,
where : N/A ,
where_sbu : N/A ,
where_sub_sbb : ,
pipe name : ,...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
04 июл 2025, 14:52
Как сгладить многоуровневый/вложенный JSON?

Последнее сообщение Anonymous « 29 ноя 2024, 21:29
Добавлено в форуме Python

Anonymous » 29 ноя 2024, 21:29 » в форуме Python

Я пытаюсь преобразовать JSON в файл CSV, который можно использовать для дальнейшего анализа. Проблема с моей структурой заключается в том, что при конвертации файла JSON у меня довольно много вложенных диктовок/списков.
Я пытался использовать pandas...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
29 ноя 2024, 21:29
Как сгладить вложенный цикл в CUDA с внутренним циклом переменной длины?

Последнее сообщение Anonymous « 01 мар 2024, 11:50
Добавлено в форуме C++

Anonymous » 01 мар 2024, 11:50 » в форуме C++

У меня есть следующий код C++, и мне нужно его распараллелить в CUDA.

#include использование пространства имен std; интервал основной() { длина целого = 4; интервал х = 3; int a = {0, 3, 6, 9, 12}; int b ; for (int я = 0; я

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
01 мар 2024, 11:50
Как сгладить вложенный цикл в CUDA с внутренним циклом переменной длины?

Последнее сообщение Anonymous « 01 мар 2024, 12:51
Добавлено в форуме C++

Anonymous » 01 мар 2024, 12:51 » в форуме C++

У меня есть следующий код C++, и мне нужно его распараллелить в CUDA.

#include использование пространства имен std; интервал основной() { константная длина int = 4; константный интервал х = 3; int a = {0, 3, 5, 9, 12}; int b ; for (int я = 0; я

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
01 мар 2024, 12:51
Сгладить нерегулярный (произвольно вложенный) список списков

Последнее сообщение Anonymous « 16 дек 2024, 22:16
Добавлено в форуме Python

Anonymous » 16 дек 2024, 22:16 » в форуме Python

Да, я знаю, что эта тема уже обсуждалась раньше:

Идиома Python для объединения (сглаживания) бесконечной итерации из конечных итераций?
Сведение неглубокого списка в Python
Понимание выравнивания последовательности последовательностей?
Как...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
16 дек 2024, 22:16

Вернуться в «Python»