Я хотел бы визуализировать эти кластеры. Обычно это делается с помощью диаграммы рассеяния и меток. Как уменьшить эту матрицу совместного появления до x и y, если в настоящее время это матрица размера N x N (N — количество уникальных слов)? Я пробовал использовать PCA:
Код: Выделить всё
plt.figure()
pca_2d = PCA(n_components=2)
reduced = pca_2d.fit_transform(mat)
newKm = KMeans(n_clusters=3)
labels = newKm.fit_predict(reduced)
plt.scatter(reduced[:, 0], reduced[:, 1], c=labels) # selects column 0 (all rows) as x coords and column 1 (all rows) as y. and then cluster labels.
plt.title("K-means Clustering")
plt.show()
Подробнее здесь: https://stackoverflow.com/questions/792 ... e-matrices
Мобильная версия