Почему мои результаты OLS и градиентного спуска значительно различаются для линейной регрессии? - Цифровое Кемерово

Почему мои результаты OLS и градиентного спуска значительно различаются для линейной регрессии? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему мои результаты OLS и градиентного спуска значительно различаются для линейной регрессии?

Цитата

Сообщение Anonymous » 18 дек 2024, 21:40

Я пишу статью, сравнивающую эффективность обычного метода наименьших квадратов (OLS) и обычного градиентного спуска (CGD) для линейной регрессии. Хотя моя реализация OLS с использованием SciPy соответствует ожидаемым результатам (например, статистическим моделям), моя реализация CGD дает совершенно другие оценки параметров даже после стандартизации данных, использования низкой скорости обучения и работы в течение многих эпох.
Вот что я сделал:
А. МНК с использованием SciPy:
Я вычисляю коэффициенты, используя нормальное уравнение замкнутой формы и псевдообратное. Обычное уравнение, которое я использую, обычное:

< /p>
Результаты соответствуют статистическим моделям:

Код: Выделить всё

beta_encoding_scipy = pinv(X_with_intercept.T @ X_with_intercept) @ X_with_intercept.T @ y

OLS Results:

Intercept                          -22.507045
Hours Studied                        2.852729
Previous Scores                      1.018319
Sleep Hours                          0.480321
Sample Question Papers Practiced     0.193910
Extracurricular Activities_No      -11.561869
Extracurricular Activities_Yes     -10.945176
dtype: float64

Б. Реализация градиентного спуска:
Я стандартизировал обучающие данные и реализовал градиентный спуск со следующей настройкой:

Скорость обучения: 0,001
Эпохи: 5000
Начальные значения: все коэффициенты установлены на 0

Моя реализация:

Код: Выделить всё

def gradient_descent(features, label, learning_rate, epochs, precision):
# Initialization
X_augmented = np.hstack((np.ones((features.shape[0], 1)), features))
beta = np.zeros(X_augmented.shape[1])  # Initialize coefficients

for epoch in range(epochs):
predictions = X_augmented @ beta
residuals = predictions - label
gradient = (2 / len(label)) * X_augmented.T @ residuals
beta = beta - learning_rate * gradient
return beta

CGD Results:

Intercept                           55.142748
Hours Studied                        7.392875
Previous Scores                     17.722890
Sleep Hours                          0.819071
Sample Question Papers Practiced     0.531543
Extracurricular Activities_No       -0.149439
Extracurricular Activities_Yes       0.149439
dtype: float64

Наблюдаемое несоответствие:
Результаты CGD далеки от результатов OLS, и я не понимаю, почему. Я подозреваю, что это может быть связано с процессом разделения данных (разделение поездов и тестов с применением StandardScaler).
Вопросы:

< li>Разве CGD не должен давать результаты, аналогичные OLS, при правильном обучении?
Может ли процесс разделения или масштабирования обучающих тестов влиять на производительность CGD?
>Что-то не так с моей реализацией CGD или инициализация параметра?

Подробнее здесь: https://stackoverflow.com/questions/792 ... near-regre

Реклама

1734547204

Anonymous

Я пишу статью, сравнивающую эффективность обычного метода наименьших квадратов (OLS) и обычного градиентного спуска (CGD) для линейной регрессии. Хотя моя реализация OLS с использованием SciPy соответствует ожидаемым результатам (например, статистическим моделям), моя реализация CGD дает совершенно другие оценки параметров даже после стандартизации данных, использования низкой скорости обучения и работы в течение многих эпох.
Вот что я сделал:
А. МНК с использованием SciPy:
Я вычисляю коэффициенты, используя нормальное уравнение замкнутой формы и псевдообратное. Обычное уравнение, которое я использую, обычное:
[img]https://i.sstatic.net/rUeLKE8k.png[/img]
< /p>
Результаты соответствуют статистическим моделям:
[code]beta_encoding_scipy = pinv(X_with_intercept.T @ X_with_intercept) @ X_with_intercept.T @ y

OLS Results:

Intercept                          -22.507045
Hours Studied                        2.852729
Previous Scores                      1.018319
Sleep Hours                          0.480321
Sample Question Papers Practiced     0.193910
Extracurricular Activities_No      -11.561869
Extracurricular Activities_Yes     -10.945176
dtype: float64
[/code]
Б. Реализация градиентного спуска:
Я стандартизировал обучающие данные и реализовал градиентный спуск со следующей настройкой:
[img] [/img]

[list]
[*]Скорость обучения: 0,001
[*] Эпохи: 5000
[*]Начальные значения: все коэффициенты установлены на 0
[/list]
Моя реализация:
[code]def gradient_descent(features, label, learning_rate, epochs, precision):
# Initialization
X_augmented = np.hstack((np.ones((features.shape[0], 1)), features))
beta = np.zeros(X_augmented.shape[1])  # Initialize coefficients

for epoch in range(epochs):
predictions = X_augmented @ beta
residuals = predictions - label
gradient = (2 / len(label)) * X_augmented.T @ residuals
beta = beta - learning_rate * gradient
return beta

CGD Results:

Intercept                           55.142748
Hours Studied                        7.392875
Previous Scores                     17.722890
Sleep Hours                          0.819071
Sample Question Papers Practiced     0.531543
Extracurricular Activities_No       -0.149439
Extracurricular Activities_Yes       0.149439
dtype: float64
[/code]
Наблюдаемое несоответствие:
Результаты CGD далеки от результатов OLS, и я не понимаю, почему. Я подозреваю, что это может быть связано с процессом разделения данных (разделение поездов и тестов с применением StandardScaler).
Вопросы:
[list]
< li>Разве CGD не должен давать результаты, аналогичные OLS, при правильном обучении?
[*]Может ли процесс разделения или масштабирования обучающих тестов влиять на производительность CGD?
[*] >Что-то не так с моей реализацией CGD или инициализация параметра?
[/list] 

Подробнее здесь: [url]https://stackoverflow.com/questions/79291892/why-do-my-ols-and-gradient-descent-results-differ-significantly-for-linear-regre[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему мои результаты OLS и градиентного спуска значительно различаются для линейной регрессии?

Последнее сообщение Anonymous « 18 дек 2024, 19:52
Добавлено в форуме Python

Anonymous » 18 дек 2024, 19:52 » в форуме Python

Я пишу статью, сравнивающую эффективность обычного метода наименьших квадратов (OLS) и обычного градиентного спуска (CGD) для линейной регрессии. Хотя моя реализация OLS с использованием SciPy соответствует ожидаемым результатам (например,...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
18 дек 2024, 19:52
Ошибка обучения и ошибка тестирования очень похожи для модели линейной регрессии при использовании градиентного спуска.

Последнее сообщение Anonymous « 14 май 2024, 21:43
Добавлено в форуме Python

Anonymous » 14 май 2024, 21:43 » в форуме Python

Мне пришлось реализовать градиентный спуск, чтобы изучить B0 и B1 для прогнозирования линейного полиномиального уравнения, программа работает как положено, но график показывает, что ошибка обучения и ошибка тестирования модели очень похожи.Вот...

0 Ответы

81 Просмотры

Последнее сообщение Anonymous
14 май 2024, 21:43
Ошибка обучения и ошибка тестирования очень похожи для модели линейной регрессии при использовании градиентного спуска.

Последнее сообщение Anonymous « 14 май 2024, 22:50
Добавлено в форуме Python

Anonymous » 14 май 2024, 22:50 » в форуме Python

Мне пришлось реализовать градиентный спуск, чтобы изучить B0 и B1 для прогнозирования линейного полиномиального уравнения, программа работает как положено, но график показывает, что ошибка обучения и ошибка тестирования модели очень похожи.Вот...

0 Ответы

57 Просмотры

Последнее сообщение Anonymous
14 май 2024, 22:50
Как смягчить высокую MAE/MSE в линейной регрессии градиентного происхождения? [закрыто]

Последнее сообщение Anonymous « 11 мар 2025, 23:28
Добавлено в форуме Python

Anonymous » 11 мар 2025, 23:28 » в форуме Python

Я узнаю об алгоритмах машинного обучения, внедряя их с нуля. Начиная с оснований, я работаю над линейной регрессией. Тем не менее, я сталкиваюсь с проблемами с производительностью модели. Учитывая простоту набора данных, я ожидал, что модель будет...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
11 мар 2025, 23:28
Почему моя функция градиентного спуска дает мне большие отрицательные значения?

Последнее сообщение Anonymous « 22 сен 2023, 09:50
Добавлено в форуме Python

Anonymous » 22 сен 2023, 09:50 » в форуме Python

Я пытаюсь запрограммировать градиентный спуск на Python. Первый код ниже отображает функцию ошибок для случаев 2D (wx+b) и 1D(wx). Второй код — это моя функция градиентного спуска, которая сохраняется как отдельная функция, то есть не в основном...

0 Ответы

59 Просмотры

Последнее сообщение Anonymous
22 сен 2023, 09:50

Вернуться в «Python»

Programmiererforum