У меня есть набор данных с двумя столбцами: SID и SUM_COUNT. Теперь мне нужно разделить SID на 5 групп с требованием, чтобы: < /p>
Сумма столбца SUM_COUNT в каждой группе должна быть максимально равной (если идеальное равенство не достижимо, то тогда как можно ближе).
SIDS в каждой группе должно быть объединено в одну сходную строку. следует: < /p>
sID sum_count
A 10
B 5
C 8
D 12
< /code>
Желаемый вывод будет выглядеть как: < /p>
Group1: sID=A,C,E | sum_count_total=30
Group2: sID=B,D,F | sum_count_total=28
< /code>
Я пробовал простую случайную группировку или сортировку с помощью sum_count и раздачи их попеременно, но результат не был идеальным. Существуют ли более эффективные алгоритмы или существующие инструменты (например, библиотеки Python или функции Dolphindb), которые могут достичь этой задачи?
Подробнее здесь: https://stackoverflow.com/questions/796 ... data-equal
Достижение группировки, чтобы сделать сумму данных каждой группы ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение