Во-первых, я ввел около 30 функций, и у меня есть 2 функции, которые имеют высокую положительную корреляцию между ними.
После этого я тренирую модель XGBoost (python) и смотрю на значения SHAP для 2 функций, значения SHAP имеют отрицательные значения. корреляция.
Не могли бы вы объяснить мне, почему выходные значения SHAP между двумя объектами не имеют такой же корреляции, как входная корреляция? и могу ли я доверять этим выводам SHAP или нет?
=======================
Корреляция между входными данными: 0,91788
Корреляция между значениями SHAP: -0,661088
2 объекта
- Население провинции
- Число семей в провинции
AUC для поезда: 0,73
AUC для теста: 0,71
График рассеяния входных данных (x: количество семей в провинции, y: население в провинции) :

Диаграмма рассеяния выходных значений SHAP (x: количество семей в провинции , y: Население провинции):

Подробнее здесь: https://stackoverflow.com/questions/590 ... lain-right
Мобильная версия