У меня есть данные, подобные приведенным ниже:
ID ID1 ID2
32336741 ["32361087"] ["36013040"]
32290433 ["32223150-32223653"] ["36003347-36003348"]
32299856 ["32361087","32299991","32223653"] ["36013040","36013029","36013040"]
В фрейме данных я пытаюсь разбить значения, разделенные запятыми, на несколько строк.
код:
fulldf = (df
.withColumn('ID1',F.explode(F.split('ID1','-')))
.withColumn("ID1",F.regexp_replace("ID1", r"\[|\]|""\"", ""))
)
fulldf = fulldf.dropna()
fulldf.display()
результат :
ID ID1
32336741 36013040
32290433 36003347
32290433 36003348
32290825 36013045
32290825 36013046
32290825 36013338
но когда я добавляю столбец ID2 в синтаксис фрейма данных, он дает мне несколько записей, например удвоенные записи.
ожидаемый вывод< /strong> :
ID ID1 ID2
32336741 32361087 36013040
32290433 32223150 36003347
32290433 32223653 36003348
32290825 32361087 36013045
32290825 32299991 36013046
32290825 32223653 36013338
Подробнее здесь: https://stackoverflow.com/questions/791 ... ng-pyspark
Как разбить значения, разделенные запятыми, во фрейме данных с помощью pyspark ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как разбить значения, разделенные запятыми, во фрейме данных с помощью pyspark
Anonymous » » в форуме Python - 0 Ответы
- 7 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Создайте новые строки фрейма данных, если столбец имеет значения, разделенные запятыми.
Anonymous » » в форуме Python - 0 Ответы
- 7 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Создайте новые строки фрейма данных, если столбец имеет значения, разделенные запятыми.
Anonymous » » в форуме Python - 0 Ответы
- 8 Просмотры
-
Последнее сообщение Anonymous
-