Нейронная сеть в кредитном риске: отзыв, точность или прецизионность? предложение по модели

Нейронная сеть в кредитном риске: отзыв, точность или прецизионность? предложение по модели ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Нейронная сеть в кредитном риске: отзыв, точность или прецизионность? предложение по модели

Цитата

Сообщение Anonymous » 24 сен 2024, 17:12

Я хотел бы поделиться с вами проектом, над которым я недавно работал. Я изучал использование нейронных сетей в области кредитного риска и был бы признателен за вашу информацию.
Как показано в прикрепленном коде, я реализовал базовую модель нейронной сети, используя набор немецких кредитных данных, который состоит из 20 независимых переменных. Код предназначен для автоматической оптимизации количества слоев и нейронов, а итоговый показатель полноты находится в диапазоне от 0,72 до 0,75. Я сосредоточился на отзыве, потому что он особенно полезен при выявлении ложных срабатываний при оценке кредитного риска. В моем случае из 1000 наблюдений бывает только 25 ложных срабатываний, как показано в приведенной ниже матрице путаницы.
Однако, как вы знаете, часто существует компромисс между отзывом , точность и производительность модели.
Мне хотелось бы услышать ваши мысли по следующим вопросам:
Как я могу улучшить код дальше? увеличить ценность запоминаемости?
Считаете ли вы, что в этом контексте более эффективно отдавать приоритет отзыву, точности или аккуратности?
есть ли какие-либо другую модель NN, которую вы предлагаете использовать? Я также попробовал байесовский метод, но время вычислений на самом деле довольно велико.
Будем очень признательны за любые другие предложения или отзывы.
ps . Я нормализовал свои данные с помощью метода minmax, но открыт для предложений.
вот результат, а затем код:
Лучший отзыв : 0,7222222222222222
Оптимальное количество слоев: 5
Оптимальное количество нейронов на слой: 32
Матрица неточностей:
КОД:
import pandas as pd
import tensorflow as tf
from imblearn.over_sampling import SMOTE
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, recall_score
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.callbacks import EarlyStopping, ReduceLROnPlateau
from tensorflow.keras.regularizers import l2
import matplotlib.pyplot as plt
import seaborn as sns

# Caricamento del dataset
file_path = 'C:\\Users\\RBoiani\\OneDrive - BDO Italia SPA\\Desktop\\Banking progetto\\German_Credit_Dataset_normalized.xlsx' # Inserisci qui il percorso del tuo file Excel
df_real = pd.read_excel(file_path)

# Separazione delle caratteristiche (X) e del target (y)
X = df_real.drop(columns=['ID', 'Risk'])
y = df_real['Risk']

# Suddivisione del dataset in training (70%) e validation (30%)
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.3, random_state=42, stratify=y)

# Applicazione di SMOTE per bilanciare la classe minoritaria
smote = SMOTE(random_state=42)
X_resampled, y_resampled = smote.fit_resample(X_train, y_train)

# Definizione della funzione per creare e addestrare la rete neurale
def create_and_train_model_balanced(X_train, y_train, X_val, y_val):
best_recall = 0
best_model = None
optimal_layers = 0
optimal_neurons = 0

for layers in range(2, 6): # Prova da 2 a 5 strati nascosti
for neurons in [32, 64, 128, 256]: # Prova con 32, 64, 128, 256 neuroni
# Creiamo il modello di rete neurale
model = Sequential()
model.add(Dense(neurons, input_dim=X_train.shape[1], activation='relu', kernel_regularizer=l2(0.001)))
model.add(Dropout(0.5))

# Aggiunta degli strati nascosti
for _ in range(layers - 1):
model.add(Dense(neurons, activation='relu', kernel_regularizer=l2(0.001)))
model.add(Dropout(0.5))

model.add(Dense(1, activation='sigmoid')) # Strato di output

# Compilazione del modello
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=[tf.keras.metrics.Recall()])

# Callback per ridurre il learning rate e prevenire overfitting
lr_scheduler = ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=3, min_lr=1e-6)
early_stopping = EarlyStopping(monitor='val_loss', patience=10, min_delta=0.01, restore_best_weights=True)

# Addestramento del modello con i dati bilanciati
history = model.fit(X_train, y_train, validation_data=(X_val, y_val),
epochs=100, batch_size=64, callbacks=[lr_scheduler, early_stopping], verbose=0)

# Calcolo della recall sul set di validazione
val_predictions = (model.predict(X_val) >= 0.5).astype(int)
recall = recall_score(y_val, val_predictions)

# Salvataggio del modello con la recall migliore
if recall > best_recall:
best_recall = recall
best_model = model
optimal_layers = layers
optimal_neurons = neurons

return best_model, best_recall, optimal_layers, optimal_neurons

# Creazione e addestramento del modello ottimale con il dataset bilanciato
model_balanced, best_recall_balanced, optimal_layers_balanced, optimal_neurons_balanced = create_and_train_model_balanced(
X_resampled, y_resampled, X_val, y_val)

# Previsioni sul set di validazione
val_predictions_balanced = (model_balanced.predict(X_val) >= 0.5).astype(int)

# Calcolo della matrice di confusione
conf_matrix_balanced = confusion_matrix(y_val, val_predictions_balanced)

# Salvataggio dei risultati finali in un file CSV
results_df_balanced = pd.DataFrame({
'ID': df_real.loc[X_val.index, 'ID'],
'Valore Reale': y_val.values,
'Predizione': val_predictions_balanced.flatten()
})
results_df_balanced.to_csv('C:\\Users\\RBoiani\\OneDrive - BDO Italia SPA\\Desktop\\Banking progetto\\risultati_prestiti.csv', index=False)

# Visualizzazione della matrice di confusione con i numeri
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix_balanced, annot=True, fmt="d", cmap='Blues', xticklabels=['Approvato', 'Rifiutato'],yticklabels=['Approvato', 'Rifiutato'])
plt.title('Matrice di Confusione - Modello Bilanciato')
plt.xlabel('Previsione')
plt.ylabel('Valore Reale')
plt.show()

# Stampa dei risultati ottimali
print(f"Best Recall: {best_recall_balanced}")
print(f"Optimal Layers: {optimal_layers_balanced}")
print(f"Optimal Neurons per Layer: {optimal_neurons_balanced}")
print(f"Confusion Matrix:\n{conf_matrix_balanced}")

Подробнее здесь: https://stackoverflow.com/questions/790 ... on-for-the

1727187131

Anonymous

Я хотел бы поделиться с вами проектом, над которым я недавно работал. Я изучал использование нейронных сетей в области кредитного риска и был бы признателен за вашу информацию.
Как показано в прикрепленном коде, я реализовал базовую модель нейронной сети, используя набор немецких кредитных данных, который состоит из 20 независимых переменных. Код предназначен для автоматической оптимизации количества слоев и нейронов, а итоговый показатель полноты находится в диапазоне от 0,72 до 0,75. Я сосредоточился на отзыве, потому что он особенно полезен при выявлении ложных срабатываний при оценке кредитного риска. В моем случае из 1000 наблюдений бывает только 25 ложных срабатываний, как показано в приведенной ниже матрице путаницы.
Однако, как вы знаете, часто существует компромисс между отзывом , точность и производительность модели.
Мне хотелось бы услышать ваши мысли по следующим вопросам:
Как я могу улучшить код дальше? увеличить ценность запоминаемости?
Считаете ли вы, что в этом контексте более эффективно отдавать приоритет отзыву, точности или аккуратности?
есть ли какие-либо другую модель NN, которую вы предлагаете использовать? Я также попробовал байесовский метод, но время вычислений на самом деле довольно велико.
Будем очень признательны за любые другие предложения или отзывы.
ps .  Я нормализовал свои данные с помощью метода minmax, но открыт для предложений.
вот результат, а затем код:
Лучший отзыв : 0,7222222222222222
Оптимальное количество слоев: 5
Оптимальное количество нейронов на слой: 32
Матрица неточностей:
КОД:
import pandas as pd
import tensorflow as tf
from imblearn.over_sampling import SMOTE
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, recall_score
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.callbacks import EarlyStopping, ReduceLROnPlateau
from tensorflow.keras.regularizers import l2
import matplotlib.pyplot as plt
import seaborn as sns

# Caricamento del dataset
file_path = 'C:\\Users\\RBoiani\\OneDrive - BDO Italia SPA\\Desktop\\Banking progetto\\German_Credit_Dataset_normalized.xlsx'   # Inserisci qui il percorso del tuo file Excel
df_real = pd.read_excel(file_path)

# Separazione delle caratteristiche (X) e del target (y)
X = df_real.drop(columns=['ID', 'Risk'])
y = df_real['Risk']

# Suddivisione del dataset in training (70%) e validation (30%)
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.3, random_state=42, stratify=y)

# Applicazione di SMOTE per bilanciare la classe minoritaria
smote = SMOTE(random_state=42)
X_resampled, y_resampled = smote.fit_resample(X_train, y_train)

# Definizione della funzione per creare e addestrare la rete neurale
def create_and_train_model_balanced(X_train, y_train, X_val, y_val):
best_recall = 0
best_model = None
optimal_layers = 0
optimal_neurons = 0

for layers in range(2, 6):  # Prova da 2 a 5 strati nascosti
for neurons in [32, 64, 128, 256]:  # Prova con 32, 64, 128, 256 neuroni
# Creiamo il modello di rete neurale
model = Sequential()
model.add(Dense(neurons, input_dim=X_train.shape[1], activation='relu', kernel_regularizer=l2(0.001)))
model.add(Dropout(0.5))

# Aggiunta degli strati nascosti
for _ in range(layers - 1):
model.add(Dense(neurons, activation='relu', kernel_regularizer=l2(0.001)))
model.add(Dropout(0.5))

model.add(Dense(1, activation='sigmoid'))  # Strato di output

# Compilazione del modello
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=[tf.keras.metrics.Recall()])

# Callback per ridurre il learning rate e prevenire overfitting
lr_scheduler = ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=3, min_lr=1e-6)
early_stopping = EarlyStopping(monitor='val_loss', patience=10, min_delta=0.01, restore_best_weights=True)

# Addestramento del modello con i dati bilanciati
history = model.fit(X_train, y_train, validation_data=(X_val, y_val),
epochs=100, batch_size=64, callbacks=[lr_scheduler, early_stopping], verbose=0)

# Calcolo della recall sul set di validazione
val_predictions = (model.predict(X_val) >= 0.5).astype(int)
recall = recall_score(y_val, val_predictions)

# Salvataggio del modello con la recall migliore
if recall >  best_recall:
best_recall = recall
best_model = model
optimal_layers = layers
optimal_neurons = neurons

return best_model, best_recall, optimal_layers, optimal_neurons

# Creazione e addestramento del modello ottimale con il dataset bilanciato
model_balanced, best_recall_balanced, optimal_layers_balanced, optimal_neurons_balanced = create_and_train_model_balanced(
X_resampled, y_resampled, X_val, y_val)

# Previsioni sul set di validazione
val_predictions_balanced = (model_balanced.predict(X_val) >= 0.5).astype(int)

# Calcolo della matrice di confusione
conf_matrix_balanced = confusion_matrix(y_val, val_predictions_balanced)

# Salvataggio dei risultati finali in un file CSV
results_df_balanced = pd.DataFrame({
'ID': df_real.loc[X_val.index, 'ID'],
'Valore Reale': y_val.values,
'Predizione': val_predictions_balanced.flatten()
})
results_df_balanced.to_csv('C:\\Users\\RBoiani\\OneDrive - BDO Italia SPA\\Desktop\\Banking progetto\\risultati_prestiti.csv', index=False)

# Visualizzazione della matrice di confusione con i numeri
plt.figure(figsize=(8, 6))
sns.heatmap(conf_matrix_balanced, annot=True, fmt="d", cmap='Blues', xticklabels=['Approvato', 'Rifiutato'],yticklabels=['Approvato', 'Rifiutato'])
plt.title('Matrice di Confusione - Modello Bilanciato')
plt.xlabel('Previsione')
plt.ylabel('Valore Reale')
plt.show()

# Stampa dei risultati ottimali
print(f"Best Recall: {best_recall_balanced}")
print(f"Optimal Layers: {optimal_layers_balanced}")
print(f"Optimal Neurons per Layer: {optimal_neurons_balanced}")
print(f"Confusion Matrix:\n{conf_matrix_balanced}")
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79019012/neural-network-in-credit-risk-recall-accuracy-or-precision-suggestion-for-the[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Нейронная сеть в кредитном риске: отзыв, точность или прецизионность?

Последнее сообщение Anonymous « 06 окт 2024, 17:11
Добавлено в форуме Python

Anonymous » 06 окт 2024, 17:11 » в форуме Python

Я хотел бы поделиться с вами проектом, над которым я недавно работал. Я изучал использование нейронных сетей в области кредитного риска и был бы признателен за вашу информацию.
Как показано в прикрепленном коде, я реализовал базовую модель нейронной...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
06 окт 2024, 17:11
Функция st_makeenvelope (двойная точность, двойная точность, двойная точность, двойная точность, целое число) не существ

Последнее сообщение Anonymous « 07 авг 2025, 10:55
Добавлено в форуме JAVA

Anonymous » 07 авг 2025, 10:55 » в форуме JAVA

function st_makeenvelope (двойная точность, двойная точность, двойная точность, двойная точность, целое число) не существует
Подсказка: Никакая функция не соответствует данным имени и типам аргументов. Вам может потребоваться добавить явные типы....

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
07 авг 2025, 10:55
Нейронная сеть C# MNIST увеличивает точность примерно до 20 %, а затем снова падает до 10 %.

Последнее сообщение Anonymous « 27 июн 2024, 23:51
Добавлено в форуме C#

Anonymous » 27 июн 2024, 23:51 » в форуме C#

Я пытался использовать этот код Python MNIST для написания нейронной сети на C# — tf-keras/notebook - но после многих попыток я не могу добиться значительного прогресса, кажется, что точность всегда составляет около 20%, прежде чем она снова падает...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
27 июн 2024, 23:51
Сверточная нейронная сеть получает неожиданно высокую точность проверки. Что может быть причиной этого?

Последнее сообщение Anonymous « 28 дек 2024, 21:11
Добавлено в форуме Python

Anonymous » 28 дек 2024, 21:11 » в форуме Python

Я создаю/оптимизирую CNN для классификации автомобилей из этого набора данных.
Моя базовая модель получает удивительно высокую точность благодаря очень простой архитектуре модели. Меня беспокоит утечка данных из-за отсутствия загрузки данных....

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
28 дек 2024, 21:11
Сверточная нейронная сеть получает неожиданно высокую точность проверки. Что может быть причиной этого?

Последнее сообщение Anonymous « 05 янв 2025, 15:53
Добавлено в форуме Python

Anonymous » 05 янв 2025, 15:53 » в форуме Python

Я создаю/оптимизирую CNN для классификации автомобилей из этого набора данных.
Моя базовая модель получает удивительно высокую точность благодаря очень простой архитектуре модели. Меня беспокоит утечка данных из-за отсутствия загрузки данных....

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
05 янв 2025, 15:53

Вернуться в «Python»