GroupBy pandas DataFrame и выберите наиболее распространенное значение.Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 GroupBy pandas DataFrame и выберите наиболее распространенное значение.

Сообщение Anonymous »

У меня есть фрейм данных с тремя строковыми столбцами. Я знаю, что только одно значение в третьем столбце действительно для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать их по фрейму данных по первым двум столбцам и выбрать наиболее распространенное значение третьего столбца для каждой комбинации.
Мой код:

Код: Выделить всё

import pandas as pd
from scipy import stats

source = pd.DataFrame({
'Country': ['USA', 'USA', 'Russia', 'USA'],
'City': ['New-York', 'New-York', 'Sankt-Petersburg', 'New-York'],
'Short name': ['NY', 'New', 'Spb', 'NY']})

source.groupby(['Country','City']).agg(lambda x: stats.mode(x['Short name'])[0])
Последняя строка кода не работает, там написано KeyError: «Короткое имя», и если я попытаюсь сгруппировать только по городу, то получу AssertionError. Что я могу сделать, чтобы это исправить?

Подробнее здесь: https://stackoverflow.com/questions/152 ... mmon-value
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Pandas DataFrame и Pandas.groupby для расчета заработной платы
    Anonymous » » в форуме Python
    0 Ответы
    4 Просмотры
    Последнее сообщение Anonymous
  • Несколько веб-API и распространенное использование зависаний в .net
    Anonymous » » в форуме C#
    0 Ответы
    9 Просмотры
    Последнее сообщение Anonymous
  • Наименьшее распространенное множество для более чем двух чисел
    Anonymous » » в форуме C++
    0 Ответы
    6 Просмотры
    Последнее сообщение Anonymous
  • Я пытаюсь получить две функции, чтобы дать мне LCM (наименьшее распространенное множество) и GCD (наибольший общий знаме
    Anonymous » » в форуме C++
    0 Ответы
    6 Просмотры
    Последнее сообщение Anonymous
  • Могу ли я определить агрегацию Pandas DataFrame Groupby с участием нескольких столбцов?
    Anonymous » » в форуме Python
    0 Ответы
    11 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»