Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк

Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк

Цитата

Сообщение Anonymous » 06 июн 2025, 09:46

У меня есть набор данных с двумя столбцами: sid (идентификатор строки) и sum_count (числовое значение). Моя цель состоит в том, чтобы разбить эти SID на 5 групп со следующими требованиями: 

Сумма значений sum_count в каждой группе должна быть максимально равной (точное равенство не требуется, но близкие приближения
предпочтительнее). string. 
< /li>
< /ol>
Пример ввода: 
sID sum_count
A 10
B 5
C 8
D 12
E 9
F 13
< /code>
Ожидаемый формат вывода: 
Group1: sID=A,C,E | sum_count_total=27
Group2: sID=B,D,F | sum_count_total=30
... # Continuing for 5 groups
< /code>
Я попробовал наивные методы, такие как: 

Случайная выборка < /li>
Сортировка с помощью sum_count с последующим раунд-робином /циклическим
, но эти породированные распределенные группы (например, ± 20%
. /> Существует ли более эффективный алгоритм или существующий инструмент (например, библиотека Python, функция Dolphindb) для достижения этого? 

Подробнее здесь: https://stackoverflow.com/questions/796 ... ggregation

1749192391

Anonymous

 У меня есть набор данных с двумя столбцами: sid  (идентификатор строки) и sum_count  (числовое значение). Моя цель состоит в том, чтобы разбить эти SID на 5 групп со следующими требованиями: < /p>

  Сумма значений sum_count в каждой группе должна быть максимально равной (точное равенство не требуется, но близкие приближения
предпочтительнее). string. < /p>
< /li>
< /ol>
Пример ввода: < /p>
sID    sum_count
A      10
B      5
C      8
D      12
E      9
F      13
< /code>
Ожидаемый формат вывода: < /p>
Group1: sID=A,C,E | sum_count_total=27
Group2: sID=B,D,F | sum_count_total=30
...  # Continuing for 5 groups
< /code>
Я попробовал наивные методы, такие как: < /p>

 Случайная выборка < /li>
 Сортировка с помощью sum_count с последующим раунд-робином /циклическим
, но эти породированные распределенные группы (например, ± 20%
. />  Существует ли более эффективный алгоритм или существующий инструмент (например, библиотека Python, функция Dolphindb) для достижения этого? < /p> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79655383/optimal-grouping-strategy-to-equalize-column-sums-with-string-aggregation[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк

Последнее сообщение Anonymous « 06 июн 2025, 06:42
Добавлено в форуме Python

Anonymous » 06 июн 2025, 06:42 » в форуме Python

У меня есть набор данных с двумя столбцами: SID (идентификатор строки) и sum_count (числовое значение). Моя цель состоит в том, чтобы разбить эти SID на 5 групп со следующими требованиями:

Сумма значений sum_count в каждой группе должна быть...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
06 июн 2025, 06:42
Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк

Последнее сообщение Anonymous « 06 июн 2025, 19:15
Добавлено в форуме Python

Anonymous » 06 июн 2025, 19:15 » в форуме Python

У меня есть набор данных с двумя столбцами: sid (идентификатор строки) и sum_count (числовое значение). Моя цель состоит в том, чтобы разбить эти SID на 5 групп со следующими требованиями:

Сумма значений sum_count в каждой группе должна быть...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
06 июн 2025, 19:15
Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк

Последнее сообщение Anonymous « 06 июн 2025, 19:21
Добавлено в форуме Python

Anonymous » 06 июн 2025, 19:21 » в форуме Python

У меня есть набор данных с двумя столбцами: sid (идентификатор строки) и sum_count (числовое значение). Моя цель состоит в том, чтобы разбить эти SID на 5 групп со следующими требованиями:

Сумма значений sum_count в каждой группе должна быть...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
06 июн 2025, 19:21
Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк

Последнее сообщение Anonymous « 30 июн 2025, 05:18
Добавлено в форуме Python

Anonymous » 30 июн 2025, 05:18 » в форуме Python

У меня есть набор данных с двумя столбцами: sid (идентификатор строки) и sum_count (числовое значение). Моя цель состоит в том, чтобы разбить эти SID на 5 групп со следующими требованиями:

Сумма значений sum_count в каждой группе должна быть...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
30 июн 2025, 05:18
Издевающийся конвейер агрегации в тесте SpringBoot завершается с ошибкой «Конвейер агрегации не должен быть нулевым»

Последнее сообщение Anonymous « 23 окт 2024, 14:25
Добавлено в форуме JAVA

Anonymous » 23 окт 2024, 14:25 » в форуме JAVA

Я работаю над тестированием агрегации MongoDB в сервисном классе Spring Boot. Тестовый класс использует Mockito для имитации операции агрегации, но при запуске теста возникает ошибка. В частности, в сообщении об ошибке говорится: «Конвейер агрегации...

0 Ответы

224 Просмотры

Последнее сообщение Anonymous
23 окт 2024, 14:25

Вернуться в «Python»