Я пробовал использовать словарную информацию дендрограммы, но когда я открыл функции Я заметил, что он ни разу не содержит информацию, которую я ввел через ссылку.
Я использую следующий код:
Код: Выделить всё
import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import dendrogram, linkage, set_link_color_palette
from scipy.cluster import hierarchy
import pandas as pd
from sklearn.decomposition import PCA
df=pd.read_csv(name+".csv", index_col=None, header=0)
normalized_df=(df-df.mean())/df.std()
pca=PCA(n_components=6, n_oversamples=6)
principalComponents = pca.fit_transform(df)
principalDF = pd.DataFrame(data = principalComponents, columns = ['principal component 1', 'principal component 2', 'principal component 3', 'principal component 4', 'principal component 5', 'principal component 6'])
#Adds the type (U/H) to the dataframe
finalDF = pd.concat([principalDF, full_df[['type']]], axis = 1)
#From here on is when I start to have problems
data = list(zip(finalDF['principal component 1'], finalDF['principal component 2']))
linkage_data = linkage(data, method='ward', metric='euclidean')
hierarchy.set_link_color_palette(['r','g','b','w'])
den=dendrogram(linkage_data)
plt.title("Attempt #1")
plt.show()
Как уже упоминалось, я пытался посмотреть на свойства дендрограммы, такие как icoord и dcoord, но не смог понять. понять, что это значит.
Сами данные, которые я использую, представляют собой 6 разных столбцов с разными числами, которые я нормализую ((df-df.mean())/df. std), а затем взять основные компоненты.
Буду признателен за любые советы.
Подробнее здесь: https://stackoverflow.com/questions/790 ... ram-python
Мобильная версия