Построение кривой ROC для многоклассовой задачи

Построение кривой ROC для многоклассовой задачи ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Построение кривой ROC для многоклассовой задачи

Цитата

Сообщение Anonymous » 06 дек 2024, 08:11

Я пытаюсь применить идею расширения sklearn ROC для мультиклассирования к моему набору данных. Моя кривая ROC для каждого класса выглядит как прямая линия, в отличие от примера sklearn, показывающего колебания кривой.
Ниже я привожу MWE, чтобы показать, что я имею в виду:

Код: Выделить всё

# all imports
import numpy as np
import matplotlib.pyplot as plt
from itertools import cycle
from sklearn import svm, datasets
from sklearn.metrics import roc_curve, auc
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import label_binarize
from sklearn.datasets import  make_classification
from sklearn.ensemble import RandomForestClassifier
# dummy dataset
X, y = make_classification(10000, n_classes=5, n_informative=10, weights=[.04, .4, .12, .5, .04])
train, test, ytrain, ytest = train_test_split(X, y, test_size=.3, random_state=42)

# random forest model
model = RandomForestClassifier()
model.fit(train, ytrain)
yhat = model.predict(test)

Затем следующая функция строит кривую ROC:

Код: Выделить всё

def plot_roc_curve(y_test, y_pred):

n_classes = len(np.unique(y_test))
y_test = label_binarize(y_test, classes=np.arange(n_classes))
y_pred = label_binarize(y_pred, classes=np.arange(n_classes))

# Compute ROC curve and ROC area for each class
fpr = dict()
tpr = dict()
roc_auc = dict()
for i in range(n_classes):
fpr[i], tpr[i], _ = roc_curve(y_test[:, i], y_pred[:, i])
roc_auc[i] = auc(fpr[i], tpr[i])

# Compute micro-average ROC curve and ROC area
fpr["micro"], tpr["micro"], _ = roc_curve(y_test.ravel(), y_pred.ravel())
roc_auc["micro"] = auc(fpr["micro"], tpr["micro"])

# First aggregate all false positive rates
all_fpr = np.unique(np.concatenate([fpr[i] for i in range(n_classes)]))

# Then interpolate all ROC curves at this points
mean_tpr = np.zeros_like(all_fpr)
for i in range(n_classes):
mean_tpr += np.interp(all_fpr, fpr[i], tpr[i])

# Finally average it and compute AUC
mean_tpr /= n_classes

fpr["macro"] = all_fpr
tpr["macro"] = mean_tpr
roc_auc["macro"] = auc(fpr["macro"], tpr["macro"])

# Plot all ROC curves
#plt.figure(figsize=(10,5))
plt.figure(dpi=600)
lw = 2
plt.plot(fpr["micro"], tpr["micro"],
label="micro-average ROC curve (area = {0:0.2f})".format(roc_auc["micro"]),
color="deeppink", linestyle=":", linewidth=4,)

plt.plot(fpr["macro"], tpr["macro"],
label="macro-average ROC curve (area = {0:0.2f})".format(roc_auc["macro"]),
color="navy", linestyle=":", linewidth=4,)

colors = cycle(["aqua", "darkorange", "darkgreen", "yellow", "blue"])
for i, color in zip(range(n_classes), colors):
plt.plot(fpr[i], tpr[i], color=color, lw=lw,
label="ROC curve of class {0} (area = {1:0.2f})".format(i, roc_auc[i]),)

plt.plot([0, 1], [0, 1], "k--", lw=lw)
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel("False Positive Rate")
plt.ylabel("True Positive Rate")
plt.title("Receiver Operating Characteristic (ROC) curve")
plt.legend()

Выход:

Код: Выделить всё

plot_roc_curve(ytest, yhat)

Вид прямой линии, изгибающейся один раз. Я хотел бы видеть производительность модели при разных пороговых значениях, а не только на одном, цифра похожа на иллюстрацию sklearn для трех классов, показанную ниже:

Подробнее здесь: https://stackoverflow.com/questions/702 ... ss-problem

1733461873

Anonymous

Я пытаюсь применить идею расширения sklearn ROC для мультиклассирования к моему набору данных. Моя кривая ROC для каждого класса выглядит как прямая линия, в отличие от примера sklearn, показывающего колебания кривой.
Ниже я привожу MWE, чтобы показать, что я имею в виду: 
[code]# all imports
import numpy as np
import matplotlib.pyplot as plt
from itertools import cycle
from sklearn import svm, datasets
from sklearn.metrics import roc_curve, auc
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import label_binarize
from sklearn.datasets import  make_classification
from sklearn.ensemble import RandomForestClassifier
# dummy dataset
X, y = make_classification(10000, n_classes=5, n_informative=10, weights=[.04, .4, .12, .5, .04])
train, test, ytrain, ytest = train_test_split(X, y, test_size=.3, random_state=42)

# random forest model
model = RandomForestClassifier()
model.fit(train, ytrain)
yhat = model.predict(test)
[/code]
Затем следующая функция строит кривую ROC:
[code]def plot_roc_curve(y_test, y_pred):

n_classes = len(np.unique(y_test))
y_test = label_binarize(y_test, classes=np.arange(n_classes))
y_pred = label_binarize(y_pred, classes=np.arange(n_classes))

# Compute ROC curve and ROC area for each class
fpr = dict()
tpr = dict()
roc_auc = dict()
for i in range(n_classes):
fpr[i], tpr[i], _ = roc_curve(y_test[:, i], y_pred[:, i])
roc_auc[i] = auc(fpr[i], tpr[i])

# Compute micro-average ROC curve and ROC area
fpr["micro"], tpr["micro"], _ = roc_curve(y_test.ravel(), y_pred.ravel())
roc_auc["micro"] = auc(fpr["micro"], tpr["micro"])

# First aggregate all false positive rates
all_fpr = np.unique(np.concatenate([fpr[i] for i in range(n_classes)]))

# Then interpolate all ROC curves at this points
mean_tpr = np.zeros_like(all_fpr)
for i in range(n_classes):
mean_tpr += np.interp(all_fpr, fpr[i], tpr[i])

# Finally average it and compute AUC
mean_tpr /= n_classes

fpr["macro"] = all_fpr
tpr["macro"] = mean_tpr
roc_auc["macro"] = auc(fpr["macro"], tpr["macro"])

# Plot all ROC curves
#plt.figure(figsize=(10,5))
plt.figure(dpi=600)
lw = 2
plt.plot(fpr["micro"], tpr["micro"],
label="micro-average ROC curve (area = {0:0.2f})".format(roc_auc["micro"]),
color="deeppink", linestyle=":", linewidth=4,)

plt.plot(fpr["macro"], tpr["macro"],
label="macro-average ROC curve (area = {0:0.2f})".format(roc_auc["macro"]),
color="navy", linestyle=":", linewidth=4,)

colors = cycle(["aqua", "darkorange", "darkgreen", "yellow", "blue"])
for i, color in zip(range(n_classes), colors):
plt.plot(fpr[i], tpr[i], color=color, lw=lw,
label="ROC curve of class {0} (area = {1:0.2f})".format(i, roc_auc[i]),)

plt.plot([0, 1], [0, 1], "k--", lw=lw)
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel("False Positive Rate")
plt.ylabel("True Positive Rate")
plt.title("Receiver Operating Characteristic (ROC) curve")
plt.legend()
[/code]
Выход:
[code]plot_roc_curve(ytest, yhat)
[/code]
[img]https://i.sstatic.net/7O1Ar.png[/img]

Вид прямой линии, изгибающейся один раз. Я хотел бы видеть производительность модели при разных пороговых значениях, а не только на одном, цифра похожа на иллюстрацию sklearn для трех классов, показанную ниже:
[img]https://i.sstatic.net/4YYEt.png[/img]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/70278059/plotting-the-roc-curve-for-a-multiclass-problem[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Расхождение между AUC ROC OUC ROC и AUC ROC Scikit-Learn для проблемы бинарной классификации

Последнее сообщение Anonymous « 20 июн 2025, 20:55
Добавлено в форуме Python

Anonymous » 20 июн 2025, 20:55 » в форуме Python

Я работаю над проблемой бинарной классификации, где у меня есть ~ 30 функций ферментных субстратов для прогнозирования EC1 и EC2. Я использую XGBOOST с Optuna для настройки гиперпараметра. Тем не менее, я наблюдаю за несоответствием между значениями...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
20 июн 2025, 20:55
Расхождение между AUC ROC OUC ROC и AUC ROC Scikit-Learn для проблемы бинарной классификации

Последнее сообщение Anonymous « 23 июл 2025, 22:30
Добавлено в форуме Python

Anonymous » 23 июл 2025, 22:30 » в форуме Python

Я работаю над проблемой бинарной классификации, где у меня есть ~ 30 функций ферментных субстратов для прогнозирования EC1 и EC2. Я использую XGBOOST с Optuna для настройки гиперпараметра. Тем не менее, я наблюдаю за несоответствием между значениями...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
23 июл 2025, 22:30
Построение кривой ROC для различных пороговых значений Python

Последнее сообщение Гость « 22 сен 2023, 10:27
Добавлено в форуме Python

Гость » 22 сен 2023, 10:27 » в форуме Python

Я использую MLP для классификации аудио. Следующий код используется для построения кривой ROC и получения оптимальных пороговых значений:

# Вычислить кривую ROC и площадь ROC для каждого класса фпр = дикт() тпр = дикт() roc_auc = dict()...

0 Ответы

24 Просмотры

Последнее сообщение Гость
22 сен 2023, 10:27
Построение кривой ROC из матрицы путаницы

Последнее сообщение Anonymous « 22 сен 2024, 17:07
Добавлено в форуме Python

Anonymous » 22 сен 2024, 17:07 » в форуме Python

Мне нужно определить, насколько хорошо разные модели классификации предсказывают значения. Для этого мне нужно построить кривую ROC, но я изо всех сил пытаюсь разработать подход.

Я включил весь свой код Python, а также ссылку на используемый мной...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
22 сен 2024, 17:07
Получить площадь под кривой ROC в Python Pyod?

Последнее сообщение Anonymous « 03 янв 2025, 22:20
Добавлено в форуме Python

Anonymous » 03 янв 2025, 22:20 » в форуме Python

У меня есть данные по 5000 наблюдений. Я разделил набор данных на две части: переменные ( X_train ) и помеченная цель ( y_train). Я использую pyod , потому что это самая популярная библиотека Python для обнаружения аномалий.
Я адаптирую модель к...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
03 янв 2025, 22:20

Вернуться в «Python»