У меня есть набор данных с двумя столбцами: sid (идентификатор строки) и sum_count (числовое значение). Моя цель состоит в том, чтобы разбить эти SID на 5 групп со следующими требованиями: < /p>
Сумма значений sum_count в каждой группе должна быть максимально равной (точное равенство не требуется, но близкие приближения
предпочтительнее). string. < /p>
< /li>
< /ol>
Пример ввода: < /p>
sID sum_count
A 10
B 5
C 8
D 12
E 9
F 13
< /code>
Ожидаемый формат вывода: < /p>
Group1: sID=A,C,E | sum_count_total=27
Group2: sID=B,D,F | sum_count_total=30
... # Continuing for 5 groups
< /code>
Я попробовал наивные методы, такие как: < /p>
Случайная выборка < /li>
Сортировка с помощью sum_count с последующим раунд-робином /циклическим
, но эти породированные распределенные группы (например, ± 20%
. /> Существует ли более эффективный алгоритм или существующий инструмент (например, библиотека Python, функция Dolphindb) для достижения этого? < /p>
Подробнее здесь: https://stackoverflow.com/questions/796 ... ggregation
Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк
Anonymous » » в форуме Python - 0 Ответы
- 2 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк
Anonymous » » в форуме Python - 0 Ответы
- 8 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк
Anonymous » » в форуме Python - 0 Ответы
- 2 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Оптимальная стратегия группировки для выравнивания сумм столбцов с помощью агрегации строк
Anonymous » » в форуме Python - 0 Ответы
- 2 Просмотры
-
Последнее сообщение Anonymous
-