Я занимаюсь анализом кредитного риска. Я хочу предсказать риск возникновения у каждой компании долга перед вымышленной компанией. Я получил важность признака из модели, но хочу знать, можно ли получить, какие показатели влияют на риск, обнаруженный для каждой компании-клиента.
Например, компания-клиент X имеет Риск 70%, и этот риск связан с переменными городом, возрастом и количеством сотрудников. Другая компания-клиент Y может иметь риск 80 %, и этот риск связан с переменными город, уровень обслуживания и средняя зарплата.
Я провожу простой первоначальный анализ, включающий следующие шаги: где модель обучена с использованием 20 показателей компаний, уже имеющих долг (классификация 1) и такого же количества других компаний, не имеющих долга (классификация 0). Модель подбирается, а затем делаются прогнозы для новых компаний без классификации.
#Define the model
rf_classifier = RandomForestClassifier(n_estimators=100, random_state=42)
#Train the model using the training data
rf_classifier.fit(X, y)
#Predictions using the asset data
y_pred = rf_classifier.predict_proba(df_companies.iloc[:, 71:])
Incorporating the data into the dataset
df_companies['Risk_0'] = y_pred[:, 0] # Probability of being class 0: no debt incurred df_companies['Risk_1'] = y_pred[:, 1] # Probability of being class 1: debt incurred
Подробнее здесь: https://stackoverflow.com/questions/790 ... dicted-row
Можно ли получить важность признака для каждой прогнозируемой строки? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как я могу проверить, что тестируемый PHP-код вызывает правильный метод для признака?
Anonymous » » в форуме Php - 0 Ответы
- 22 Просмотры
-
Последнее сообщение Anonymous
-