Заполнить значения с помощью groupby в PySpark ⇐ Python
-
Гость
Заполнить значения с помощью groupby в PySpark
Как заполнить значения na в столбце цен на автомобили df, используя группировку по версии и заполняя эти значения na с помощью медианы?
Я сделал это с помощью панд:
median_price=df.groupby("версия")["цена"].transform("медиана") df["цена"].fillna(median_price, inplace=True) Но я не могу придумать такую логику для pyspark... Не могли бы вы мне помочь?
Как заполнить значения na в столбце цен на автомобили df, используя группировку по версии и заполняя эти значения na с помощью медианы?
Я сделал это с помощью панд:
median_price=df.groupby("версия")["цена"].transform("медиана") df["цена"].fillna(median_price, inplace=True) Но я не могу придумать такую логику для pyspark... Не могли бы вы мне помочь?
Мобильная версия