Сохранить наибольшее значение на основе суммы двух групп в пандах

Сохранить наибольшее значение на основе суммы двух групп в пандах ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Сохранить наибольшее значение на основе суммы двух групп в пандах

Цитата

Сообщение Anonymous » 15 июл 2025, 23:00

У меня есть пандас данных. DataFrame имеет 4 столбца. Последний - это всего лишь некоторые случайные данные. Первые два столбца - это столбцы, которые я буду группировать и суммировать столбец значения. Из каждой группировки я хотел бы только сохранить первую строку (то есть группа с самой большой суммой). 

Мои данные: 

import pandas as pd

df = pd.DataFrame(data=[['0', 'A', 3, 'a'],
['0', 'A', 2, 'b'],
['0', 'A', 1, 'c'],
['0', 'B', 3, 'd'],
['0', 'B', 4, 'e'],
['0', 'B', 4, 'f'],
['1', 'C', 3, 'g'],
['1', 'C', 2, 'h'],
['1', 'C', 1, 'i'],
['1', 'D', 3, 'j'],
['1', 'D', 4, 'k'],
['1', 'D', 4, 'l']
], columns=['group col 1', 'group col 2', 'value', 'random data']
)
< /code>

желаемый вывод: 

group col 1 group col 2 value random data
3 0 B 3 d
4 0 B 4 e
5 0 B 4 f
9 1 D 3 j
10 1 D 4 k
11 1 D 4 l
< /code>

У меня есть неэффективный способ добраться туда, но ищу более простое решение. 

Мое решение: 

df1 = df.groupby(['group col 1','group col 2']).agg('sum').reset_index()
biggest_groups= df1.sort_values(by=['group col 1', 'value'], ascending=[True, False])
biggest_groups = biggest_groups.groupby('group col 1').head(1)
pairs = biggest_groups[['group col 1', 'group col 2']].values.tolist()
pairs = [tuple(i) for i in pairs]
df = df[df[['group col 1', 'group col 2']].apply(tuple, axis = 1).isin(pairs)]

Подробнее здесь: https://stackoverflow.com/questions/610 ... -in-pandas

1752609644

Anonymous

 У меня есть пандас данных. DataFrame имеет 4 столбца. Последний - это всего лишь некоторые случайные данные. Первые два столбца - это столбцы, которые я буду группировать и суммировать столбец значения. Из каждой группировки я хотел бы только сохранить первую строку (то есть группа с самой большой суммой). < /P>

Мои данные: < /p>

import pandas as pd

df = pd.DataFrame(data=[['0', 'A', 3, 'a'],
['0', 'A', 2, 'b'],
['0', 'A', 1, 'c'],
['0', 'B', 3, 'd'],
['0', 'B', 4, 'e'],
['0', 'B', 4, 'f'],
['1', 'C', 3, 'g'],
['1', 'C', 2, 'h'],
['1', 'C', 1, 'i'],
['1', 'D', 3, 'j'],
['1', 'D', 4, 'k'],
['1', 'D', 4, 'l']
], columns=['group col 1', 'group col 2', 'value', 'random data']
)
< /code>

желаемый вывод: < /p>

       group col 1 group col 2  value random data
3            0           B      3           d
4            0           B      4           e
5            0           B      4           f
9            1           D      3           j
10           1           D      4           k
11           1           D      4           l
< /code>

У меня есть неэффективный способ добраться туда, но ищу более простое решение. < /p>

Мое решение: < /p>

df1 = df.groupby(['group col 1','group col 2']).agg('sum').reset_index()
biggest_groups= df1.sort_values(by=['group col 1', 'value'], ascending=[True, False])
biggest_groups = biggest_groups.groupby('group col 1').head(1)
pairs = biggest_groups[['group col 1', 'group col 2']].values.tolist()
pairs = [tuple(i) for i in pairs]
df = df[df[['group col 1', 'group col 2']].apply(tuple, axis = 1).isin(pairs)]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/61037523/keep-largest-value-based-on-sum-of-two-groupbys-in-pandas[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Найдите наибольшее (наибольшее, максимальное) число в списке чисел

Последнее сообщение Anonymous « 17 май 2025, 17:35
Добавлено в форуме Python

Anonymous » 17 май 2025, 17:35 » в форуме Python

Как я могу легко найти наибольшее число в данном списке чисел? - В этом особом случае эти два значения также можно сравнить напрямую.

Подробнее здесь:

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
17 май 2025, 17:35
В одномерном числовом массиве мы можем получить наибольшее значение суммы. Однако мы можем получить его для различного т

Последнее сообщение Anonymous « 03 июл 2025, 10:11
Добавлено в форуме Python

Anonymous » 03 июл 2025, 10:11 » в форуме Python

I have a piece of code and want them to find max sum for float and complex number too. however i am getting error

```lang-python
def max_subarray_sum(nums: list) -> complex:
if not nums:
return 0
max_sum = current_sum = nums
for num in nums :...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
03 июл 2025, 10:11
В одномерном числовом массиве мы можем получить наибольшее значение суммы. Однако мы можем получить его для различного т

Последнее сообщение Anonymous « 03 июл 2025, 11:28
Добавлено в форуме Python

Anonymous » 03 июл 2025, 11:28 » в форуме Python

У меня есть кусок кода, и я хочу, чтобы они нашли максимальную сумму для плавания и комплексного номера. Однако я получаю ошибку
def max_subarray_sum(nums: list) -> complex:
if not nums:
return 0
max_sum = current_sum = nums
for num in nums :...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
03 июл 2025, 11:28
Могу ли я заставить сериализатор Symfony требовать присутствия всех групп? Не одна из списка групп?

Последнее сообщение Anonymous « 07 ноя 2024, 15:50
Добавлено в форуме Php

Anonymous » 07 ноя 2024, 15:50 » в форуме Php

Например, у меня есть недвижимость
#[Groups( )]
public mixed $name;

Я хочу, чтобы сериализатор игнорировал это свойство, если все группы не находятся в контексте. Например, здесь по умолчанию он все равно будет включен:
$this->json($user, context:...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 15:50
PHP для управления и объединения всех ролей из нескольких групп пользователей. Один пользователь, несколько групп пользо

Последнее сообщение Anonymous « 13 ноя 2024, 06:48
Добавлено в форуме Php

Anonymous » 13 ноя 2024, 06:48 » в форуме Php

Мне нужно создать функцию, которая могла бы объединить все роли из групп пользователей, чтобы один пользователь мог иметь доступ ко всем заданным ролям.
public function GetRoles($id = 'new', $module = null) {
$json = [];

$groups =...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
13 ноя 2024, 06:48

Вернуться в «Python»