Ниже приведен пример фрейма данных под названием «матрица», который есть в моей программе:
[img]https://i.sstatic. net/3Kzkzbdl.png[/img]
У меня есть переменная под названием "plimit", которая в настоящее время равна 0,7.
Мне нужен алгоритм, который кластеризует сделаны из кадра данных. Все в кластере должно иметь корреляцию друг с другом выше plimit (0,7+). Ниже приводится список всех таких кластеров.
(A, A)
(A, C)
(A, E)
(A , F)
(B, B)
(B, C)
(B, E)
(C, A)
(C, B)
(C, C)
(C, E)
(D, D)
(E, A)
(E, B)
(E, C)
(E, E)
(F, A)
(G, G)
(A, C, E)
(B, C, E )
(A, B, C, E)
Я хочу, чтобы все повторы были удалены (т.е. удалены (C, A), поскольку (A, C) уже здесь) . Я хочу, чтобы все пары «я» были удалены (т.е. удалили (A, A)). В идеале эти повторы и самопары вообще не генерируются для экономии вычислительной мощности, хотя я понимаю, что их необходимо создавать.
В результате у нас должно остаться:(A, C)
(A, E)
(A, F)
(B, C)
(B, E)
(C , E)
(A, C, E)
(B, C, E)
(A, B, C, E)
Эти все это должно быть конечным результатом, содержащим не больше и не меньше этих 9 кластеров для этого примера кадра данных.
Подробнее здесь: https://stackoverflow.com/questions/786 ... at-everyth
Как я могу эффективно генерировать все возможные кластеры элементов, чтобы все внутри кластера коррелировало друг с друг ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Ошибка Java/Python Spark при запуске инструмента Найти кластеры точек в ArcGIS Pro
Anonymous » » в форуме JAVA - 0 Ответы
- 12 Просмотры
-
Последнее сообщение Anonymous
-