Pyspark - применение определенной пользовательской функции (UDF) ко всей строке DataFramePython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Pyspark - применение определенной пользовательской функции (UDF) ко всей строке DataFrame

Сообщение Anonymous »

Я вполне новичок в pyspark, хотя часто пользователь Pandas и т. Д. , где идентификатор является целым числом, траектория-это список строк данных, содержащих координат-информацию, а тип-это список строк < /p>
Цель состоит в Каждый идентификатор, нарисуйте полилин в карте Python Folium Map, основанной на координатах в списке-концерте траектории.

Код: Выделить всё

df.first()
дает следующий результат
Row(ID=209223000, Trajectory=[Row(Timestamp=datetime.datetime(2024, 11, 1, 2, 58, 29), Latitude=55.108018, Longitude=18.306343, Destination='Unknown'), Row(Timestamp=datetime.datetime(2024, 11, 1, 6, 18, 18), Latitude=55.115625, Longitude=18.103083, Destination='Unknown')], types=['Undefined'])
< /code>
Итак, чтобы быть ясным, мне не нужно добавлять дополнительный столбец в DataFrame, и никаких возражений, если это тоже нуждается. < /p>
Так что псевдо будет выглядеть что -то, что: < /p>
create map-object m

For each Row in df:
create polyline object ply
ply.coordinates = [item.Lat,item.Long] for item in Row['Trajectory']
ply.tooltip = Row['ID'] + Row[types]
add ply to m
< /code>
Конечная цель состоит Описанный псевдокод, но я не могу обернуть голову вокруг, как применить UDF, так как UDF применяется на столбце, а не на DataFrame. < /p>
ожидаемый результат будет добавлен Полилины для карты-объекта на основе каждой строки DataFrame, например, Каждый отдельный идентификатор.

Подробнее здесь: https://stackoverflow.com/questions/794 ... -dataframe
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Pyspark - применение определенной пользовательской функции (UDF) ко всей строке DataFrame
    Anonymous » » в форуме Python
    0 Ответы
    3 Просмотры
    Последнее сообщение Anonymous
  • Встроенные функции PySpark для удаления UDF
    Anonymous » » в форуме Python
    0 Ответы
    21 Просмотры
    Последнее сообщение Anonymous
  • Полярные поля и применение UDF по столбцу
    Anonymous » » в форуме Python
    0 Ответы
    8 Просмотры
    Последнее сообщение Anonymous
  • Pyspark UDF для удаления чисел из строкового адреса
    Anonymous » » в форуме Python
    0 Ответы
    12 Просмотры
    Последнее сообщение Anonymous
  • Apache Spark (pyspark) — преобразование двоичного файла в str (UUID) без UDF
    Anonymous » » в форуме Python
    0 Ответы
    32 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»