Чрезвычайно высокое среднеквадратическое отклонение при тестировании на линейную регрессию

Чрезвычайно высокое среднеквадратическое отклонение при тестировании на линейную регрессию ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Чрезвычайно высокое среднеквадратическое отклонение при тестировании на линейную регрессию

Цитата

Сообщение Anonymous » 03 ноя 2024, 06:51

import numpy as np
import pandas as pd

pd.set_option('future.no_silent_downcasting', True)

class LinearRegression:
def __init__(self, x_train, y_train, epochs=20, alpha=0.01):
self.x_train = pd.DataFrame(x_train)
self.y_train = pd.DataFrame(y_train).values.reshape(-1, 1)
self.shape = x_train.shape
self.x_scale_factor = self.x_train.max(axis=0)
self.y_scale_factor = self.y_train.max()
self.x_train /= self.x_scale_factor
self.y_train /= self.y_scale_factor
self.weight_matrix = np.random.rand(1, self.shape[1])
self.bias_matrix = np.random.rand(1, 1)
self.epochs = epochs
self.alpha = alpha
self.error = 0

def train(self):
for i in range(self.epochs):
predictions = np.dot(self.x_train, self.weight_matrix.T) + self.bias_matrix
error_matrix = ((self.y_train - predictions) ** 2) / self.shape[0]
self.error = np.sum(error_matrix)
weight_gradient = -2 * np.dot((self.y_train - predictions).T, self.x_train) / self.shape[0]
bias_gradient = -2 * np.mean(self.y_train - predictions)
self.weight_matrix -= self.alpha * weight_gradient
self.bias_matrix -= self.alpha * bias_gradient

if i % 10 == 0:
print(f"Epoch {i} \t error: {self.error}")
print(self.weight_matrix)
print(self.bias_matrix)

def predict(self, x_features):
x_features = pd.DataFrame(x_features)
x_features /= self.x_scale_factor
y_predictions = np.dot(x_features, self.weight_matrix.T) + self.bias_matrix
y_predictions *= self.y_scale_factor
return y_predictions

def evaluate(self, x_test, y_test):
x_test, y_test = pd.DataFrame(x_test), pd.DataFrame(y_test).values.reshape(-1, 1)
x_test /= self.x_scale_factor
y_predict = self.predict(x_test)
rmse = np.sqrt(np.mean((y_predict - y_test) ** 2))
return rmse

# Example usage
train_data = pd.read_csv('Dataset/House price/df_train.csv')
train_data = train_data.drop('date', axis=1)
x_train = train_data.drop(columns=['price']).sample(frac=1)
x_train = x_train.replace({True: 1, False: 0}).astype(int)
y_train = train_data['price'].sample(frac=1)
model = LinearRegression(x_train, y_train, epochs=500, alpha=0.1)
model.train()

test_data = pd.read_csv('Dataset/House price/df_test.csv')
x_test = test_data.drop(columns=['price', 'date'])
x_test = x_test.replace({True: 1, False: 0}).astype(int)
y_test = test_data['price']

print(f"Root Mean Squared Error: {model.evaluate(x_test, y_test)}")

Сценарий приводит к очень высокому RMSE во время процесса оценки, но к прилично низкому MSE во время обучения. Дополнительную информацию см. на прикрепленном изображении.

Я попробовал отредактировать функцию оценки, включив в нее и другие функции ошибок. Точность тоже нулевая.

Подробнее здесь: https://stackoverflow.com/questions/791 ... regression

1730605912

Anonymous

[code]import numpy as np
import pandas as pd

pd.set_option('future.no_silent_downcasting', True)

class LinearRegression:
def __init__(self, x_train, y_train, epochs=20, alpha=0.01):
self.x_train = pd.DataFrame(x_train)
self.y_train = pd.DataFrame(y_train).values.reshape(-1, 1)
self.shape = x_train.shape
self.x_scale_factor = self.x_train.max(axis=0)
self.y_scale_factor = self.y_train.max()
self.x_train /= self.x_scale_factor
self.y_train /= self.y_scale_factor
self.weight_matrix = np.random.rand(1, self.shape[1])
self.bias_matrix = np.random.rand(1, 1)
self.epochs = epochs
self.alpha = alpha
self.error = 0

def train(self):
for i in range(self.epochs):
predictions = np.dot(self.x_train, self.weight_matrix.T) + self.bias_matrix
error_matrix = ((self.y_train - predictions) ** 2) / self.shape[0]
self.error = np.sum(error_matrix)
weight_gradient = -2 * np.dot((self.y_train - predictions).T, self.x_train) / self.shape[0]
bias_gradient = -2 * np.mean(self.y_train - predictions)
self.weight_matrix -= self.alpha * weight_gradient
self.bias_matrix -= self.alpha * bias_gradient

if i % 10 == 0:
print(f"Epoch {i} \t error: {self.error}")
print(self.weight_matrix)
print(self.bias_matrix)

def predict(self, x_features):
x_features = pd.DataFrame(x_features)
x_features /= self.x_scale_factor
y_predictions = np.dot(x_features, self.weight_matrix.T) + self.bias_matrix
y_predictions *= self.y_scale_factor
return y_predictions

def evaluate(self, x_test, y_test):
x_test, y_test = pd.DataFrame(x_test), pd.DataFrame(y_test).values.reshape(-1, 1)
x_test /= self.x_scale_factor
y_predict = self.predict(x_test)
rmse = np.sqrt(np.mean((y_predict - y_test) ** 2))
return rmse

# Example usage
train_data = pd.read_csv('Dataset/House price/df_train.csv')
train_data = train_data.drop('date', axis=1)
x_train = train_data.drop(columns=['price']).sample(frac=1)
x_train = x_train.replace({True: 1, False: 0}).astype(int)
y_train = train_data['price'].sample(frac=1)
model = LinearRegression(x_train, y_train, epochs=500, alpha=0.1)
model.train()

test_data = pd.read_csv('Dataset/House price/df_test.csv')
x_test = test_data.drop(columns=['price', 'date'])
x_test = x_test.replace({True: 1, False: 0}).astype(int)
y_test = test_data['price']

print(f"Root Mean Squared Error: {model.evaluate(x_test, y_test)}")
[/code]
Сценарий приводит к очень высокому RMSE во время процесса оценки, но к прилично низкому MSE во время обучения. Дополнительную информацию см. на прикрепленном изображении.
[img]https://i.sstatic.net/p3eOi2fg.png[/img]

Я попробовал отредактировать функцию оценки, включив в нее и другие функции ошибок. Точность тоже нулевая. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79149175/extremely-high-rmse-in-testing-for-linear-regression[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Чрезвычайно высокое среднеквадратическое отклонение при тестировании на линейную регрессию

Последнее сообщение Anonymous « 01 ноя 2024, 22:23
Добавлено в форуме Python

Anonymous » 01 ноя 2024, 22:23 » в форуме Python

import numpy as np
import pandas as pd

pd.set_option('future.no_silent_downcasting', True)

class LinearRegression:
def __init__(self, x_train, y_train, epochs=20, alpha=0.01):
self.x_train = pd.DataFrame(x_train)
self.y_train =...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 22:23
Чрезвычайно высокое среднеквадратическое отклонение при тестировании на линейную регрессию

Последнее сообщение Anonymous « 11 ноя 2024, 04:48
Добавлено в форуме Python

Anonymous » 11 ноя 2024, 04:48 » в форуме Python

import numpy as np
import pandas as pd

pd.set_option('future.no_silent_downcasting', True)

class LinearRegression:
def __init__(self, x_train, y_train, epochs=20, alpha=0.01):
self.x_train = pd.DataFrame(x_train)
self.y_train =...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
11 ноя 2024, 04:48
Как применить линейную регрессию к каждому пикселю в большом многомерном массиве, содержащем NaN?

Последнее сообщение Anonymous « 09 апр 2024, 21:33
Добавлено в форуме Python

Anonymous » 09 апр 2024, 21:33 » в форуме Python

У меня есть одномерный массив значений независимых переменных ( x_array ), которые соответствуют временным шагам в трехмерном массиве пространственных данных с несколькими временными шагами ( y_array). Мои фактические данные намного больше: более...

0 Ответы

47 Просмотры

Последнее сообщение Anonymous
09 апр 2024, 21:33
Как выполнить линейную регрессию в sklearn с помощью специальной функции потерь

Последнее сообщение Anonymous « 15 дек 2024, 03:50
Добавлено в форуме Python

Anonymous » 15 дек 2024, 03:50 » в форуме Python

Я использую линейную регрессию в sklearn
model = LinearRegression()
model.fit(x_poly, y_true)

Вместо использования стандартной функции потерь (я думаю, это MSE), чтобы соответствовать моей линейной регрессии. Я хотел бы определить метрику...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
15 дек 2024, 03:50
Как предсказать модель, используя линейную регрессию?

Последнее сообщение Anonymous « 05 май 2025, 09:39
Добавлено в форуме Python

Anonymous » 05 май 2025, 09:39 » в форуме Python

Я пытаюсь предсказать цену корпуса для этого набора данных

Я пытаюсь использовать модель линейной регрессии, я получаю ошибку значения как
valueError: не удалось преобразовать строку в плавание: как показано ниже

import numpy as np
import pandas...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
05 май 2025, 09:39

Вернуться в «Python»