У меня есть файл df. Я хочу сгруппировать по столбцу, найти режим второго столбца на основе группы и заполнить все значения np.NaN в группе во втором столбце наиболее распространенным значением.
Я чувствую, что обхожу это стороной и не получаю ответа.
Я пробовал .mask, .transform и .agg. Я использовал лямбда-функции и пытался работать с индексами, но не добился того, чего хотел. Должно быть, я неправильно соединяю части.
Вот краткий пример.
Начните с чего-то вроде этого.
Код: Выделить всё
df =
Passenger_Group HomePlanet
1 1 Earth
2 1 Mars
3 1 Earth
4 1 NaN
5 2 NaN
6 2 Venus
7 3 Ceres
Цель состоит в том, чтобы в конечном итоге получить df, который выглядит вот так
Код: Выделить всё
df =
Passenger_Group HomePlanet
1 1 Earth
2 1 Mars
3 1 Earth
4 1 Earth
5 2 Venus
6 2 Venus
7 3 Ceres
Каков краткий питонический способ сделать это?
Подробнее здесь: https://stackoverflow.com/questions/792 ... cular-mode
Мобильная версия