Заполнить значения с помощью groupby в PySparkPython

Программы на Python
Ответить
Гость
 Заполнить значения с помощью groupby в PySpark

Сообщение Гость »


Как заполнить значения na в столбце цен на автомобили df, используя группировку по версии и заполняя эти значения na с помощью медианы?

Я сделал это с помощью панд:

median_price=df.groupby("версия")["цена"].transform("медиана") df["цена"].fillna(median_price, inplace=True) Но я не могу придумать такую ​​логику для pyspark... Не могли бы вы мне помочь?
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»