Значение SHAP может объяснить, верно?

Значение SHAP может объяснить, верно? ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 15 янв 2025, 16:32

У меня возникла проблема с использованием значения SHAP для интерпретации древовидной модели (https://github.com/slundberg/shap).
Во-первых, я ввел около 30 функций, и у меня есть 2 функции, которые имеют высокую положительную корреляцию между ними.

После этого я тренирую модель XGBoost (python) и смотрю на значения SHAP для 2 функций, значения SHAP имеют отрицательные значения. корреляция.
Не могли бы вы объяснить мне, почему выходные значения SHAP между двумя объектами не имеют такой же корреляции, как входная корреляция? и могу ли я доверять этим выводам SHAP или нет?
=======================

Корреляция между входными данными: 0,91788

Корреляция между значениями SHAP: -0,661088
2 объекта

Население провинции
Число семей в провинции

Эффективность модели

AUC для поезда: 0,73

AUC для теста: 0,71
График рассеяния входных данных (x: количество семей в провинции, y: население в провинции) :

Диаграмма рассеяния выходных значений SHAP (x: количество семей в провинции , y: Население провинции):

Подробнее здесь: https://stackoverflow.com/questions/590 ... lain-right

1736947950

Anonymous

У меня возникла проблема с использованием значения SHAP для интерпретации древовидной модели (https://github.com/slundberg/shap).
Во-первых, я ввел около 30 функций, и у меня есть 2 функции, которые имеют высокую положительную корреляцию между ними.

После этого я тренирую модель XGBoost (python) и смотрю на значения SHAP для 2 функций, значения SHAP имеют отрицательные значения. корреляция.
Не могли бы вы объяснить мне, почему выходные значения SHAP между двумя объектами не имеют такой же корреляции, как входная корреляция? и могу ли я доверять этим выводам SHAP или нет?
=======================

Корреляция между входными данными: 0,91788

Корреляция между значениями SHAP: -0,661088
2 объекта
[list]
[*]Население провинции
[*]Число семей в провинции
[/list]
Эффективность модели

AUC для поезда: 0,73

AUC для теста: 0,71
График рассеяния входных данных (x: количество семей в провинции, y: население в провинции) :

[img]https://i.sstatic.net/E3QOS.png[/img]

Диаграмма рассеяния выходных значений SHAP (x: количество семей в провинции , y: Население провинции):

[img]https://i.sstatic.net/fgd3M.png[/img]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/59035008/shap-value-can-explain-right[/url]