GroupBy pandas DataFrame и выберите наиболее распространенное значение.

GroupBy pandas DataFrame и выберите наиболее распространенное значение. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

GroupBy pandas DataFrame и выберите наиболее распространенное значение.

Цитата

Сообщение Anonymous » 01 авг 2024, 06:51

У меня есть фрейм данных с тремя строковыми столбцами. Я знаю, что только одно значение в третьем столбце действительно для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать их по фрейму данных по первым двум столбцам и выбрать наиболее распространенное значение третьего столбца для каждой комбинации.
Мой код:

Код: Выделить всё

import pandas as pd
from scipy import stats

source = pd.DataFrame({
'Country': ['USA', 'USA', 'Russia', 'USA'],
'City': ['New-York', 'New-York', 'Sankt-Petersburg', 'New-York'],
'Short name': ['NY', 'New', 'Spb', 'NY']})

source.groupby(['Country','City']).agg(lambda x: stats.mode(x['Short name'])[0])

Последняя строка кода не работает, там написано KeyError: «Короткое имя», и если я попытаюсь сгруппировать только по городу, то получу AssertionError. Что я могу сделать, чтобы это исправить?

Подробнее здесь: https://stackoverflow.com/questions/152 ... mmon-value

1722484306

Anonymous

У меня есть фрейм данных с тремя строковыми столбцами. Я знаю, что только одно значение в третьем столбце действительно для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать их по фрейму данных по первым двум столбцам и выбрать наиболее распространенное значение третьего столбца для каждой комбинации.
Мой код:
[code]import pandas as pd
from scipy import stats

source = pd.DataFrame({
'Country': ['USA', 'USA', 'Russia', 'USA'],
'City': ['New-York', 'New-York', 'Sankt-Petersburg', 'New-York'],
'Short name': ['NY', 'New', 'Spb', 'NY']})

source.groupby(['Country','City']).agg(lambda x: stats.mode(x['Short name'])[0])
[/code]
Последняя строка кода не работает, там написано KeyError: «Короткое имя», и если я попытаюсь сгруппировать только по городу, то получу AssertionError. Что я могу сделать, чтобы это исправить? 

Подробнее здесь: [url]https://stackoverflow.com/questions/15222754/groupby-pandas-dataframe-and-select-most-common-value[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Pandas DataFrame и Pandas.groupby для расчета заработной платы

Последнее сообщение Anonymous « 05 июн 2025, 14:27
Добавлено в форуме Python

Anonymous » 05 июн 2025, 14:27 » в форуме Python

Для моего назначения мне нужно импортировать данные о зарплате бейсбола в Pandas DataFrame .

Оттуда одна из моих целей - получить заработную плату всех команд в год.

Я был успешным, однако, чтобы перейти на следующую задачу, мне нужно данных...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
05 июн 2025, 14:27
Несколько веб-API и распространенное использование зависаний в .net

Последнее сообщение Anonymous « 24 сен 2024, 11:47
Добавлено в форуме C#

Anonymous » 24 сен 2024, 11:47 » в форуме C#

У меня есть приложение, содержащее несколько проектов веб-API в .net. Я использую MongoDb. Теперь я хочу добавить в это приложение обычное зависание. Другими словами, будет одна база данных Hangfire, и все проекты веб-API будут управлять заданиями...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 11:47
Наименьшее распространенное множество для более чем двух чисел

Последнее сообщение Anonymous « 10 фев 2025, 18:25
Добавлено в форуме C++

Anonymous » 10 фев 2025, 18:25 » в форуме C++

Я хочу найти наименьшее распространенное множественное (LCM) более двух чисел. Я знаю формулу lcm (a, b) = (a * b) / gcd (a, b) . Допустим, у меня есть массив чисел: , и LCM должен быть модулем M = 1000000007.
Я видел ниже код для расчета LCM Из...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
10 фев 2025, 18:25
Я пытаюсь получить две функции, чтобы дать мне LCM (наименьшее распространенное множество) и GCD (наибольший общий знаме

Последнее сообщение Anonymous « 16 июл 2025, 00:19
Добавлено в форуме C++

Anonymous » 16 июл 2025, 00:19 » в форуме C++

Я работаю над проектом, который генерирует выигрышные номера лотереи, которые имеют определенные условия, они должны начинать с 0, длиться 7 цифр и быть делится на 3, 5 и 7, что означает, что вы должны иметь возможность разделить его на его LCM, что...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
16 июл 2025, 00:19
Могу ли я определить агрегацию Pandas DataFrame Groupby с участием нескольких столбцов?

Последнее сообщение Anonymous « 12 фев 2025, 17:44
Добавлено в форуме Python

Anonymous » 12 фев 2025, 17:44 » в форуме Python

Я экспериментировал и прочитал документацию для dataframegroupby.aggregate, но мне не ясно, и как я могу определить агрегацию, которая работает на нескольких столбцах. Мне кажется, что агрегации, указанные с назначением аргумента ключевого слова для...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
12 фев 2025, 17:44

Вернуться в «Python»