Я пытаюсь построить простой трубопровод ML в Python, используя Scikit-learn.
Мой набор данных имеет как категориальные, так и численные функции. Я хочу применить OneHotencoder к категориальным столбцам, а затем подготовить модель LogisticRession .
Вот мой код:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.linear_model import LogisticRegression
data = pd.DataFrame({
"age": [25, 32, 40, 29],
"city": ["Delhi", "Mumbai", "Delhi", "Bangalore"],
"purchased": [0, 1, 0, 1]
})
X = data[["age", "city"]]
y = data["purchased"]
categorical_features = ["city"]
numeric_features = ["age"]
preprocessor = ColumnTransformer(
transformers=[
("cat", OneHotEncoder(), categorical_features),
("num", "passthrough", numeric_features)
]
)
pipeline = Pipeline(steps=[
("preprocessor", preprocessor),
("model", LogisticRegression())
])
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25)
pipeline.fit(X_train, y_train) #
Подробнее здесь: https://stackoverflow.com/questions/797 ... ogisticreg
ValueError при подгонке трубопровода Scikit-Learn с OneHotencoder и логистической регрессией ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Каковы плюсы и минусы между get_dummies (pandas) и Onehotencoder (scikit-learn)?
Anonymous » » в форуме Python - 0 Ответы
- 4 Просмотры
-
Последнее сообщение Anonymous
-