В настоящее время я работаю над моделью для прогнозирования вероятности летального исхода после заражения человека вирусом Короны.
Я использую голландский набор данных с категориальными переменными: дата заражения, летальный исход или излечение, пол, возрастная группа и т. д.
Было предложено использовать дерево решений, которое я уже построил.
Поскольку я новичок в деревьях решений, мне нужна помощь.
Я хотелось бы, чтобы прогноз (целевая переменная) выражался в вероятности (%), а не в двоичном виде.
Как я могу этого добиться?
Также я хочу поиграть с выборками, вводя данные сам и посмотреть, каков будет результат.
Например: возьмем человека 40 лет, мужчину и т. д., и посчитаем, каков его шанс на выживание.
Как я могу этого добиться?
Я прикрепил код ниже:
from pandas import read_csv
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
import pandas as pd
import random as rnd
filename = '/Users/sef/Downloads/pima-indians-diabetes.csv'
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
dataframe = read_csv(filename, names=names)
array = dataframe.values
X = array[:,0:8]
Y = array[:,8]
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=1234)
model = DecisionTreeClassifier()
model.fit(X_train, Y_train)
DecisionTreeClassifier(class_weight=None, criterion='gini', max_depth=None,
max_features=None, max_leaf_nodes=None,
min_impurity_decrease=0.0, min_impurity_split=None,
min_samples_leaf=1, min_samples_split=2,
min_weight_fraction_leaf=0.0, presort=False, random_state=None,
splitter='best')
rnd.seed(123458)
X_new = X[rnd.randrange(X.shape[0])]
X_new = X_new.reshape(1,8)
YHat = model.predict_proba(X_new)
df = pd.DataFrame(X_new, columns = names[:-1])
df["predicted"] = YHat
print(df)
Подробнее здесь: https://stackoverflow.com/questions/633 ... ity-target
Дерево решений с целевой вероятностью ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Автоматизированное принятие решений с использованием классификатора дерева решений
Anonymous » » в форуме Python - 0 Ответы
- 4 Просмотры
-
Последнее сообщение Anonymous
-