Средние цифровые столбцы и возвращайте отдельную строку для строковых столбцов с помощью Pandas Groupby

Средние цифровые столбцы и возвращайте отдельную строку для строковых столбцов с помощью Pandas Groupby ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Средние цифровые столбцы и возвращайте отдельную строку для строковых столбцов с помощью Pandas Groupby

Цитата

Сообщение Anonymous » 21 апр 2025, 06:29

У меня есть дата, которая выглядит как следующее: < /p>

Код: Выделить всё

    ID  Type    Size
0   123 Red     5
1   456 Blue    7
2   789 Yellow  12
3   789 Yellow  4

Я теперь хочу агрегировать по id и взять среднее значение для дубликатов. Тем не менее, я хочу вернуть только ту же строку для типа , а не объединить ее. Я попытался запечатлеть это, используя Agg :

Код: Выделить всё

df = pd.DataFrame({'ID' : [123, 456, 789, 789], 'Type' : ['Red', 'Blue', 'Yellow', 'Yellow'], 'Size' : [5, 7, 12, 4]})

def identity(x):
return x

special_columns = ['Type']
aggfuncs = {col: statistics.mean for col in df.columns}
aggfuncs.update({col:identity for col in special_columns})
df.groupby(['ID'], as_index=False).agg(aggfuncs)
< /code>
Однако это все еще превращается в массив повторной строки: < /p>
    ID  Type              Size
0   123 Red                 5
1   456 Blue                7
2   789 [Yellow, Yellow]    8
< /code>
конечный результат, который я хотел: < /p>
    ID  Type              Size
0   123 Red                 5
1   456 Blue                7
2   789 Yellow              8

Как это можно достичь?

Подробнее здесь: https://stackoverflow.com/questions/724 ... ing-pandas

1745206174

Anonymous

 У меня есть дата, которая выглядит как следующее: < /p>
[code]    ID  Type    Size
0   123 Red     5
1   456 Blue    7
2   789 Yellow  12
3   789 Yellow  4
[/code]
Я теперь хочу агрегировать по id  и взять среднее значение  для дубликатов. Тем не менее, я хочу вернуть только ту же строку для типа , а не объединить ее. Я попытался запечатлеть это, используя Agg : 
[code]df = pd.DataFrame({'ID' : [123, 456, 789, 789], 'Type' : ['Red', 'Blue', 'Yellow', 'Yellow'], 'Size' : [5, 7, 12, 4]})

def identity(x):
return x

special_columns = ['Type']
aggfuncs = {col: statistics.mean for col in df.columns}
aggfuncs.update({col:identity for col in special_columns})
df.groupby(['ID'], as_index=False).agg(aggfuncs)
< /code>
Однако это все еще превращается в массив повторной строки: < /p>
    ID  Type              Size
0   123 Red                 5
1   456 Blue                7
2   789 [Yellow, Yellow]    8
< /code>
конечный результат, который я хотел: < /p>
    ID  Type              Size
0   123 Red                 5
1   456 Blue                7
2   789 Yellow              8
[/code]
Как это можно достичь?  

Подробнее здесь: [url]https://stackoverflow.com/questions/72494759/average-numeric-columns-and-return-single-string-for-string-columns-using-pandas[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как мне принять средние средние значения данных

Последнее сообщение Anonymous « 26 авг 2025, 04:55
Добавлено в форуме JAVA

Anonymous » 26 авг 2025, 04:55 » в форуме JAVA

У меня есть текстовый файл средних цен на газ за каждую неделю в год, и мне нужно обрабатывать данные, получив ежемесячные средние значения этих цен. Это упражнение требует, чтобы я поместил 52-недельные средние значения в массив и показал...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
26 авг 2025, 04:55
Pandas Groupby Несколько столбцов, агрегируйте некоторые столбцы, добавьте столбец каждой группы каждой группы

Последнее сообщение Anonymous « 19 фев 2025, 12:51
Добавлено в форуме Python

Anonymous » 19 фев 2025, 12:51 » в форуме Python

Данные, с которыми я работаю:
data (140631115432592), ndim: 2, size: 3947910, shape: (232230, 17)
VIN (1-10) object
County object
City object
State object
Postal Code float64
Model Year int64
Make object
Model object
Electric Vehicle Type object...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
19 фев 2025, 12:51
Преобразование типов dtypes в грязный фрейм данных pandas? числовые столбцы суммы имеют небольшое количество строковых з

Последнее сообщение Anonymous « 11 ноя 2024, 04:26
Добавлено в форуме Python

Anonymous » 11 ноя 2024, 04:26 » в форуме Python

У меня есть большой фрейм данных. Я хочу преобразовать их в соответствующий тип dtype. Проблема в том, что в нескольких числовых столбцах есть строки. Я знаю про Convert_dtypes и to_numeric.

Проблема с Convert_dtypes заключается в том, что он не...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
11 ноя 2024, 04:26
GroupBy и добавить рассчитанные столбцы на основе нескольких условий из других столбцов

Последнее сообщение Anonymous « 26 фев 2025, 00:33
Добавлено в форуме Python

Anonymous » 26 фев 2025, 00:33 » в форуме Python

У меня есть набор данных, который я хочу Groupby, а затем добавляю несколько рассчитанных столбцов на основе условий из других столбцов. Я хочу, чтобы статус включал только «open» и «закрыто», и я хочу, чтобы состояние исключало «fl». />
Пока что у...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
26 фев 2025, 00:33
Pandas groupby — группировать столбцы в список количества значений строк

Последнее сообщение Anonymous « 05 июл 2024, 13:47
Добавлено в форуме Python

Anonymous » 05 июл 2024, 13:47 » в форуме Python

Я хочу сгруппировать свой фрейм данных по столбцу с суммой значений из других строк в настроенном представлении.
Мой фрейм данных:| Release | Pass | Fail | Total |
|:---------:|:----:|:----:|:-----:|
| release_a | 10 | 20 | 30 |
| release_a | 5 | 45...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
05 июл 2024, 13:47

Вернуться в «Python»