Почему моя логистическая регрессия имеет точность 25%?Python

Программы на Python
Ответить
Anonymous
 Почему моя логистическая регрессия имеет точность 25%?

Сообщение Anonymous »

Я реализую логистическую регрессию. Я знаю, что уже существует множество библиотек для его реализации. Но дело в том, что я не могу с ними разобраться. Поэтому я создал для него свой собственный набор данных.
В нем есть 3 параметра: цена дома, стандарт и решение о покупке

Код: Выделить всё

Standard
представляет уровень жизни.
: низкий
: средний
: высокий
Когда цена дома очень низкая, только люди с низким() уровень жизни будет покупать.
Когда дом очень высок, только люди с высоким() уровень жизни купит.
Вот что я сделал

Код: Выделить всё

# %%
from sklearn.datasets import load_breast_cancer
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import pandas
from sklearn.preprocessing import StandardScaler

# %%
house_buy = pandas.read_csv("Datasets/house.csv")
house_buy

# %%
house_test = pandas.read_csv("Datasets/house test.csv")
house_test.head()

# %%
house_independent = house_buy.iloc[:,:-1]
house_dependent = house_buy["Buy Prediction"]

# %%
column_names = house_independent.columns.tolist()
column_names

# %%
scaler = StandardScaler()
scaled_house_independent = pandas.DataFrame(scaler.fit_transform(house_independent), columns=column_names)
scaled_house_independent.head()

# %%
house_dependent.shape

# %%
house_test_independent = house_test.iloc[:,:2]
house_test_dependent = house_test["Buy Prediction"]
house_test_independent, house_test_dependent

# %%
# Scaled house test
scaled_house_test_independent = pandas.DataFrame(scaler.transform(house_test_independent), columns=column_names)
scaled_house_test_independent

# %%
house_regression_model = LogisticRegression(random_state=42).fit(scaled_house_independent, house_dependent)

# %%
#Test
house_predicted_dependent = house_regression_model.predict(scaled_house_test_independent)
house_predicted_dependent

# %%
accuracy = accuracy_score(house_test_dependent,house_predicted_dependent)
accuracy

# %%
Вот набор данных и файл ipynb моей реализации.
Тестовый набор данных имеет массив (1,1,0,0) как решение о покупке, но моя модель дает array(0,1,1,1)
Я знаю, что мой набор данных невелик, но это не должно быть единственной причиной такого низкого значения точность.
Что я делаю не так? Как это сделать?

Подробнее здесь: https://stackoverflow.com/questions/792 ... 5-accuracy
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»