Я студент, изучаю обучение без учителя. И мне нужно решить проблему: кластеризовать 10 тыс. точек данных по 128 измерений. Я пробовал k-means++, спектральную кластеризацию, HDBSCAN, MeanShift и так далее, но они потратили слишком много времени и кажутся не очень точными. Для обучения я не могу использовать scikit-learn, могу только импортировать numpy. Может ли кто-нибудь дать мне совет или пример кода?
Я попробовал k-means++, но форма данных не соответствует k-means.
Спектральная кластеризация: занимает слишком много времени. много времени (я использовал knn для создания весовой матрицы).
Другие упомянутые методы занимают слишком много времени.
Подробнее здесь: https://stackoverflow.com/questions/785 ... ional-data
Как мне найти правильный способ кластеризации большого количества данных большой размерности? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение