Проблема с настроенной линейной регрессией

Проблема с настроенной линейной регрессией ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Проблема с настроенной линейной регрессией

Цитата

Сообщение Anonymous » 04 июл 2024, 01:44

Я изучаю машинное обучение и изучаю модели. Моей последней задачей было написать модель множественной линейной регрессии с оптимизацией MSE (без использования существующей в sklearn) и протестировать ее на данных.
Моя модель:

Код: Выделить всё

  def linear_regression(x: np.array, y: np.array, learning_speed: float = 0.1, echoes: int = 1000):

n = len(y)
coef = np.zeros(len(x[0]) + 1)

for _ in range(echoes):

d = np.array([]) # Array to contain a step for each coef

for idx in range(len(coef)):
d_coef = 0
for row in range(len(x)):
if idx == len(coef) - 1:
d_coef += (1) * (np.sum(coef[:-1] * x[row]) + coef[-1] - y[row])
else:
d_coef += (x[row, idx]) * (np.sum(coef[:-1] * x[row]) - y[row] + coef[-1]) # Sum of derivatives of (V1X1 + ... + VnXn + b - y) related to coef idx
d = np.append(d, (2 / n) * d_coef)

coef -= learning_speed * d

print(f'coef = {coef[:-1]}')
print(f'b = {coef[-1]}')

После того, как я протестировал модель на некоторых наборах данных. Для небольших наборов данных это работало отлично. Но потом я попробовал больший:

Код: Выделить всё

x1_rnd = np.array([])
x2_rnd = np.array([])
c1 = 5
c2 = 0.75
b = 15
for _ in range(500):
x1_rnd = np.append(x1_rnd, np.random.randint(1, 100))
x2_rnd = np.append(x2_rnd, np.random.randint(1, 100))

combo = zip(x1_rnd, x2_rnd)
x = np.array([list(elem) for elem in combo])
y_rnd = c1 * x1_rnd + c2 * x2_rnd + b

И в моей модели есть существенная ошибка. Даже при 20000 итерациях (и скорости обучения = 0,0001) он более или менее предсказывает коэффициенты для X1 и X2, но остается очень далеким от предсказания «b». Я заметил, что меньшее значение «b» приводит к лучшему прогнозу, а большее — к худшему (например, если оно равно 0,1, модель работает правильно и быстро; если b = 100, это кошмар).
Я не могу найти никаких ошибок в градиентном спуске кода. Пожалуйста, помогите решить проблему!

Подробнее здесь: https://stackoverflow.com/questions/787 ... regression

1720046686

Anonymous

Я изучаю машинное обучение и изучаю модели. Моей последней задачей было написать модель множественной линейной регрессии с оптимизацией MSE (без использования существующей в sklearn) и протестировать ее на данных.
Моя модель:
[code]  def linear_regression(x: np.array, y: np.array, learning_speed: float = 0.1, echoes: int = 1000):

n = len(y)
coef = np.zeros(len(x[0]) + 1)

for _ in range(echoes):

d = np.array([]) # Array to contain a step for each coef

for idx in range(len(coef)):
d_coef = 0
for row in range(len(x)):
if idx == len(coef) - 1:
d_coef += (1) * (np.sum(coef[:-1] * x[row]) + coef[-1] - y[row])
else:
d_coef += (x[row, idx]) * (np.sum(coef[:-1] * x[row]) - y[row] + coef[-1]) # Sum of derivatives of (V1X1 + ... + VnXn + b - y) related to coef idx
d = np.append(d, (2 / n) * d_coef)

coef -= learning_speed * d

print(f'coef = {coef[:-1]}')
print(f'b = {coef[-1]}')
[/code]
После того, как я протестировал модель на некоторых наборах данных. Для небольших наборов данных это работало отлично. Но потом я попробовал больший:
[code]x1_rnd = np.array([])
x2_rnd = np.array([])
c1 = 5
c2 = 0.75
b = 15
for _ in range(500):
x1_rnd = np.append(x1_rnd, np.random.randint(1, 100))
x2_rnd = np.append(x2_rnd, np.random.randint(1, 100))

combo = zip(x1_rnd, x2_rnd)
x = np.array([list(elem) for elem in combo])
y_rnd = c1 * x1_rnd + c2 * x2_rnd + b
[/code]
И в моей модели есть существенная ошибка. Даже при 20000 итерациях (и скорости обучения = 0,0001) он более или менее предсказывает коэффициенты для X1 и X2, но остается очень далеким от предсказания «b». Я заметил, что меньшее значение «b» приводит к лучшему прогнозу, а большее — к худшему (например, если оно равно 0,1, модель работает правильно и быстро; если b = 100, это кошмар).
Я не могу найти никаких ошибок в градиентном спуске кода. Пожалуйста, помогите решить проблему! 

Подробнее здесь: [url]https://stackoverflow.com/questions/78704446/problem-with-customized-linear-regression[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Sklearn или Pandas, вмешайте недостающие значения с простой линейной регрессией

Последнее сообщение Anonymous « 04 май 2025, 09:00
Добавлено в форуме Python

Anonymous » 04 май 2025, 09:00 » в форуме Python

У меня есть данные временных рядов, и я хочу вменять недостающие данные. Я не могу использовать среднее из столбца, потому что я думаю, что это нехорошо для данных временных рядов. Day, Price
1, NaN
2, NaN
3, 1800
4, 1900
5, NaN
6, NaN
7, 2000
8,...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
04 май 2025, 09:00
Sklearn или Pandas, вмешайте недостающие значения с простой линейной регрессией

Последнее сообщение Anonymous « 04 май 2025, 11:21
Добавлено в форуме Python

Anonymous » 04 май 2025, 11:21 » в форуме Python

У меня есть данные временных рядов, и я хочу вменять недостающие данные. Я не могу использовать среднее из столбца, потому что я думаю, что это нехорошо для данных временных рядов. Day, Price
1, NaN
2, NaN
3, 1800
4, 1900
5, NaN
6, NaN
7, 2000
8,...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
04 май 2025, 11:21
Как изменить max_iter в функции оптимизации, используемой регрессией гауссовского процесса sklearn?

Последнее сообщение Anonymous « 14 янв 2025, 17:52
Добавлено в форуме Python

Anonymous » 14 янв 2025, 17:52 » в форуме Python

Я использую GPR-библиотеку sklearn, но иногда сталкиваюсь с этим надоедливым предупреждением:

ConvergenceWarning: lbfgs failed to converge (status=2):
ABNORMAL_TERMINATION_IN_LNSRCH.

Increase the number of iterations (max_iter) or scale the data...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
14 янв 2025, 17:52
Выполнение пакетных прогнозов с точно настроенной моделью PALM в Vertex AI всегда выдает ValueError.

Последнее сообщение Anonymous « 01 июн 2024, 00:33
Добавлено в форуме Python

Anonymous » 01 июн 2024, 00:33 » в форуме Python

Для моего кода:
import vertexai
from vertexai.preview.language_models import TextGenerationModel

model = TextGenerationModel.get_tuned_model( projects/PROJECT_ID/locations/us-central1/models/MODEL_ID )
batch_file=f'gs://my_bucket/test_.jsonl'...

0 Ответы

92 Просмотры

Последнее сообщение Anonymous
01 июн 2024, 00:33
Создание динамического объекта в настроенной сцене

Последнее сообщение Anonymous « 31 май 2024, 21:34
Добавлено в форуме C++

Anonymous » 31 май 2024, 21:34 » в форуме C++

Как можно с помощью Qt Designer создать простой графический интерфейс, выполняющий то, что показано на прикрепленном изображении.
А именно: после однократного нажатия ЛКМ устанавливается маркер в месте щелчка, обозначающем начало многоугольника....

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
31 май 2024, 21:34

Вернуться в «Python»