Учитывая кадр данных pyspark, содержащий описания иерархии, как я могу извлечь полную структуру иерархии для данного иде

Учитывая кадр данных pyspark, содержащий описания иерархии, как я могу извлечь полную структуру иерархии для данного иде ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Учитывая кадр данных pyspark, содержащий описания иерархии, как я могу извлечь полную структуру иерархии для данного иде

Цитата

Сообщение Anonymous » 28 фев 2024, 13:43

У меня есть такая таблица:

columns = ["Structure_ID", "Position", "Hierarchy", "Key", "Key_Text"] data = [(1, 101, 1, 10000, "Европа"), (1, 102, 2, 11 000, "Франция"), (1, 103, 3, 11 100, "Париж"), (1, 104, 1, 20000, «Азия»), (1, 105, 2, 21000, «Япония»)] df_original = spark.createDataFrame(данные).toDF(*столбцы) df_original.show() #+------------+--------+---------+-----+--------+ #|Идентификатор_структуры|Позиция|Иерархия| Ключ|Текст_ключа| #+------------+--------+---------+-----+--------+ #| 1| 101| 1|10000| Европа| #| 1| 102| 2|11000| Франция| #| 1| 103| 3|11100| Париж| #| 1| 104| 1|20000| Азия| #| 1| 105| 2|21000| Япония| #+------------+--------+---------+-----+--------+ Я хочу иметь возможность получить для данного идентификатора структуры и позиции, например. Structure_ID = 1 и Position = 105, ключевой текст из этой позиции, а также из любых верхних уровней, т. е. в этом примере из Азии и Японии.

Я преобразовал исходную таблицу очень громоздким способом (множество объединений и временное создание нового столбца для каждого уровня иерархии) в такой вид:

#+------------+--------+---------+---------- ------------+ #|Идентификатор_структуры|Позиция|Иерархия| Ключ_массив| #+------------+--------+---------+---------------- ------+ #| 1| 101| 1| [Европа]| #| 1| 102| 2| [Европа, Франция]| #| 1| 103| 3|[Европа, Франция, Париж| #| 1| 104| 1| [Азия]| #| 1| 105| 2| [Азия, Япония]| #+------------+--------+---------+---------------- ------+ Если выходной формат имеет смысл, мне интересно, как эффективно преобразовать исходную таблицу в этот. В противном случае я хотел бы знать, что имело бы смысл, возможно, есть ли в Python/pyspark древовидная структура?

1709116994

Anonymous


У меня есть такая таблица:
 
columns = ["Structure_ID", "Position", "Hierarchy", "Key", "Key_Text"] data = [(1, 101, 1, 10000, "Европа"), (1, 102, 2, 11 000, "Франция"), (1, 103, 3, 11 100, "Париж"), (1, 104, 1, 20000, «Азия»), (1, 105, 2, 21000, «Япония»)] df_original = spark.createDataFrame(данные).toDF(*столбцы) df_original.show() #+------------+--------+---------+-----+--------+ #|Идентификатор_структуры|Позиция|Иерархия| Ключ|Текст_ключа| #+------------+--------+---------+-----+--------+ #| 1| 101| 1|10000| Европа| #| 1| 102| 2|11000| Франция| #| 1| 103| 3|11100| Париж| #| 1| 104| 1|20000| Азия| #| 1| 105| 2|21000| Япония| #+------------+--------+---------+-----+--------+  Я хочу иметь возможность получить для данного идентификатора структуры и позиции, например. Structure_ID = 1 и Position = 105, ключевой текст из этой позиции, а также из любых верхних уровней, т. е. в этом примере из Азии и Японии.
 
Я преобразовал исходную таблицу очень громоздким способом (множество объединений и временное создание нового столбца для каждого уровня иерархии) в такой вид:
 
#+------------+--------+---------+---------- ------------+ #|Идентификатор_структуры|Позиция|Иерархия| Ключ_массив| #+------------+--------+---------+---------------- ------+ #| 1| 101| 1| [Европа]| #| 1| 102| 2| [Европа, Франция]| #| 1| 103| 3|[Европа, Франция, Париж| #| 1| 104| 1| [Азия]| #| 1| 105| 2| [Азия, Япония]| #+------------+--------+---------+---------------- ------+  Если выходной формат имеет смысл, мне интересно, как эффективно преобразовать исходную таблицу в этот. В противном случае я хотел бы знать, что имело бы смысл, возможно, есть ли в Python/pyspark древовидная структура?

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ошибка получения ошибки иерархии пользовательского интерфейса при получении иерархии UI иерархии XML Файл: com.android.d

Последнее сообщение Anonymous « 26 янв 2025, 14:48
Добавлено в форуме Android

Anonymous » 26 янв 2025, 14:48 » в форуме Android

Я тестирую свое приложение с помощью ADB, но я получаю эту ошибку, когда я выполняю «Иерархия представления дампа для uiautomator»:

Ошибка Получение ошибки иерархии UI при получении иерархии UI XML
файл: com.android.ddmlib.syncexception:...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
26 янв 2025, 14:48
Добавление краткого описания на страницу корзины без начала «описания:»

Последнее сообщение Anonymous « 13 май 2024, 10:12
Добавлено в форуме Php

Anonymous » 13 май 2024, 10:12 » в форуме Php

Я наткнулся на этот старый вопрос/решение.
Проблема, которая до сих пор не решена, — это основной вывод desryption: на странице корзины/оформления заказа.
Все работает нормально, за исключением этого вывода.
Как мы можем это удалить?
Я искал другой...

0 Ответы

64 Просмотры

Последнее сообщение Anonymous
13 май 2024, 10:12
Pandas: как преобразовать кадр данных M*N в кадр данных (M*N)*1

Последнее сообщение Anonymous « 28 фев 2024, 13:37
Добавлено в форуме Python

Anonymous » 28 фев 2024, 13:37 » в форуме Python

Предположим, у меня есть кадр данных размером 2*3:
df = pd.DataFrame({'A': , 'B': , 'C': }) А Б С 0 1 3 5 1 2 4 6 Мне интересно, как преобразовать df в кадр данных (2*3)*1, который имеет следующую форму? Я пробовал pd.DataFrame.explode() и...

0 Ответы

87 Просмотры

Последнее сообщение Anonymous
28 фев 2024, 13:37
Учитывая кадр данных с меткой времени в качестве индекса и двумя столбцами с идентификаторами и логическими значениями,

Последнее сообщение Anonymous « 16 май 2024, 11:53
Добавлено в форуме Python

Anonymous » 16 май 2024, 11:53 » в форуме Python

У меня есть кадр данных pandas с двумя столбцами и индексом, который является объектом datettime, первый столбец — это идентификатор, а второй столбец — логическое значение. Для данного идентификатора логический столбец может иметь значение True или...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
16 май 2024, 11:53
Как загрузить файлы на диск с помощью AppsScript и Promises, чтобы гарантировать, что файл был загружен до получения иде

Последнее сообщение Гость « 23 сен 2023, 19:11
Добавлено в форуме Javascript

Гость » 23 сен 2023, 19:11 » в форуме Javascript

Извините за плохой английский текст ;(

Я изо всех сил пытался создать функцию загрузки файла, которая использовала бы обещания для загрузки, а затем возвращала идентификатор файла.

Раньше я проводил пару исследований, и многие из них сработали...

0 Ответы

34 Просмотры

Последнее сообщение Гость
23 сен 2023, 19:11

Вернуться в «Python»