Набор данных «По умолчанию» имеет следующие столбцы: по умолчанию, студент, доход, баланс
Переменная «по умолчанию» ' имеет два значения: "Да" и "Нет"
Код: Выделить всё
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
from ISLP import load_data
from ISLP.models import (ModelSpec as MS,
summarize,
poly)
from ISLP import confusion_table
Default = load_data('Default')
vars = Default.columns.drop(['default'])
y = Default['default'] == 'Yes'
design = MS(vars)
X = design.fit_transform(Default)
glm = sm.GLM(y,
X,
family = sm.families.Binomial())
results = glm.fit()
summarize(results)
probs = results.predict()
labels = np.array(['No']*10000)
labels[probs>0.5] = 'Yes'
confusion_table(labels,Default.default)
Мне нужна таблица путаницы. значениями быть только «Да» и «Нет». Каким-то образом для меток numpy.array установлено значение «Да» вместо «Да».
Подробнее здесь: https://stackoverflow.com/questions/792 ... e-variable
Мобильная версия