
Я должен рассчитать DTI и проверить распределение по различным категориям Пол, Семейное положение и Занятость. И предложите сегменты высокого риска. Я использовал приведенный ниже код для создания диаграммы Seaborn с различными комбинациями категорий для типа занятости, dti, семейного положения и пола, но без информации, а затем еще одной диаграммы с информацией о целевой переменной (is_delinquent), который является флагом для клиентов с просроченными и не просроченными платежами.
Я хочу знать, какой подход является правильным для предложения сегментов высокого риска - с целевой переменной информацией или без нее? Потому что во время оценки кредита и понимания кредитного риска кредитные менеджеры не имеют никакого представления о целевой переменной и полагаются исключительно на такие коэффициенты, как DTI. Все, что превышает 40% dti, считается сегментом высокого риска, но следует ли предлагать их с просрочкой или без нее, потому что с просрочкой количество сегментов резко увеличивается?
# Chart with no delinquency
plt.figure(figsize = (15, 10))
cat = sns.catplot(x = "Employment_Type", y = "dti", data = cust_data, kind = "bar", row = 'Marital_Status', col = 'Gender')
cat.fig.suptitle('Customer Segmentation: Employment Type Vs Marital Status Vs Gender with no Delinquency info')
cat.set_titles(row_template='Marital Status: {row_name}', col_template='Gender: {col_name}')
cat.set_xlabels('Employment Type')
cat.set_ylabels('Debt to Income (%)')
for ax in cat.axes.ravel():
for c in ax.containers:
ax.bar_label(c, label_type='edge')
ax.margins(y=0.1)
plt.show()
Затем у меня есть еще одна диаграмма, содержащая информацию о просрочках.
# Chart with delinquency
plt.figure(figsize = (15, 10))
cat = sns.catplot(x = "Employment_Type", y = "dti", data = cust_data, kind = "bar", row = 'Marital_Status', col = 'Gender', hue = 'is_delinquent')
cat.fig.suptitle('Customer Segmentation: Employment Type Vs Marital Status Vs Gender with Delinquency info')
cat.set_titles(row_template='Marital Status: {row_name}', col_template='Gender: {col_name}')
cat.set_xlabels('Employment Type')
cat.set_ylabels('Debt to Income (%)')
for ax in cat.axes.ravel():
for c in ax.containers:
ax.bar_label(c, label_type='edge')
ax.margins(y=0.1)
plt.show()
Подробнее здесь: https://stackoverflow.com/questions/798 ... -customers
Мобильная версия