Код: Выделить всё
tranOH = ColumnTransformer([ ('one', OneHotEncoder(drop='first', dtype='int'),
make_column_selector(dtype_include='category', pattern=f"^(?!{target}).*")
) ], remainder='passthrough')
dftrain2 = tranOH.fit_transform(dftrain)
cph = CoxPHFitter(penalizer=0.1)
cph.fit(dftrain2, 'months', 'churn')
Код: Выделить всё
mcox = Pipeline(steps=[
("onehot", tranOH),
('modelo', CoxPHFitter(penalizer=0.1))
])
mcox.fit(dftrain, modelo__duration_col="months", modelo__event_col='churn')
Код: Выделить всё
CoxPHFitter.fit() got multiple values for argument 'duration_col'
Я также пробовал использовать col="months" и event_col=target непосредственно внутри CoxPHitter(), но я получаю ту же ошибку.
Позже я хочу использовать его для выполнения GridSearchCV для точной настройки пенализатора параметр, оптимизирующий показатель точности для прогнозирования оттока в заданное время="месяцы".
Подробнее здесь: https://stackoverflow.com/questions/790 ... a-pipeline