Сгруппируйте по одному столбцу, получите режим другого и заполните na этим конкретным режимом [дубликат]

Сгруппируйте по одному столбцу, получите режим другого и заполните na этим конкретным режимом [дубликат] ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Сгруппируйте по одному столбцу, получите режим другого и заполните na этим конкретным режимом [дубликат]

Цитата

Сообщение Anonymous » 28 ноя 2024, 00:16

df =
Passenger_Group    HomePlanet
1        1                  Earth
2        1                  Mars
3        1                  Earth
4        1                  NaN
5        2                  NaN
6        2                  Venus
7        3                  Ceres

Обратите внимание, что в полном наборе данных гораздо больше столбцов и строк, поэтому мне приходится работать с именами других столбцов.
Цель состоит в том, чтобы в конечном итоге получить df, который выглядит вот так

Код: Выделить всё

df =
Passenger_Group    HomePlanet
1        1                  Earth
2        1                  Mars
3        1                  Earth
4        1                  Earth
5        2                  Venus
6        2                  Venus
7        3                  Ceres

Мне кажется, это должна быть простая команда. Однако все, что я пытаюсь сделать, не совсем работает.
Каков краткий питонический способ сделать это?

Подробнее здесь: https://stackoverflow.com/questions/792 ... cular-mode

1732742198

Anonymous

Я играю с набором данных SpaceShipTitanic на Kaggle.
У меня есть файл df. Я хочу сгруппировать по столбцу, найти режим второго столбца на основе группы и заполнить все значения np.NaN в группе во втором столбце наиболее распространенным значением.
Я чувствую, что обхожу это стороной и не получаю ответа.
Я пробовал .mask, .transform и .agg. Я использовал лямбда-функции и пытался работать с индексами, но не добился того, чего хотел. Должно быть, я неправильно соединяю части.
Вот краткий пример.
Начните с чего-то вроде этого.
[code]df =
Passenger_Group HomePlanet
1 1 Earth
2 1 Mars
3 1 Earth
4 1 NaN
5 2 NaN
6 2 Venus
7 3 Ceres
[/code]
Обратите внимание, что в полном наборе данных гораздо больше столбцов и строк, поэтому мне приходится работать с именами других столбцов.
Цель состоит в том, чтобы в конечном итоге получить df, который выглядит вот так
[code]df =
Passenger_Group HomePlanet
1 1 Earth
2 1 Mars
3 1 Earth
4 1 Earth
5 2 Venus
6 2 Venus
7 3 Ceres
[/code]
Мне кажется, это должна быть простая команда. Однако все, что я пытаюсь сделать, не совсем работает.
Каков краткий питонический способ сделать это?

Подробнее здесь: [url]https://stackoverflow.com/questions/79231837/group-by-one-column-get-mode-of-another-and-fill-na-with-that-particular-mode[/url]