Я пытаюсь найти наиболее ценные объекты, применяя методы отбора объектов к своему набору данных. Сейчас я использую функцию SelectKBest. Я могу генерировать значения оценок и сортировать их по своему усмотрению, но я не понимаю, как именно рассчитывается это значение оценки. Я знаю, что теоретически высокий балл более ценен, но для глубокого изучения мне нужна математическая формула или пример для расчета балла.
Код: Выделить всё
bestfeatures = SelectKBest(score_func=chi2, k=10)
fit = bestfeatures.fit(dataValues, dataTargetEncoded)
feat_importances = pd.Series(fit.scores_, index=dataValues.columns)
topFatures = feat_importances.nlargest(50).copy().index.values
print("TOP 50 Features (Best to worst) :\n")
print(topFatures)
Заранее спасибо