Заполнить значения с помощью groupby в PySpark

Заполнить значения с помощью groupby в PySpark ⇐ Python

1 сообщение • Страница 1 из 1

Гость

Заполнить значения с помощью groupby в PySpark

Сообщение Гость » 23 сен 2023, 08:36

Как заполнить значения na в столбце цен на автомобили df, используя группировку по версии и заполняя эти значения na с помощью медианы?

Я сделал это с помощью панд:

median_price=df.groupby("версия")["цена"].transform("медиана") df["цена"].fillna(median_price, inplace=True) Но я не могу придумать такую логику для pyspark... Не могли бы вы мне помочь?

Гость

1 сообщение • Страница 1 из 1

Вернуться в «Python»