Регрессия PyTorch LSTM: взять только последнее выходное значение или взять все выходные значения LSTM? - Цифровое Кемерово

Регрессия PyTorch LSTM: взять только последнее выходное значение или взять все выходные значения LSTM? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Регрессия PyTorch LSTM: взять только последнее выходное значение или взять все выходные значения LSTM?

Цитата

Сообщение Anonymous » 17 окт 2024, 19:02

Я пытаюсь обучить свою первую регрессионную модель LSTM на основе данных о глобальной средней температуре. Температура доступна для каждого месяца, начиная с 1 января 1850 года.
Из того, что я узнал в Интернете, я ввожу 12 месяцев подряд в LSTM и позволяю ему прогнозировать следующий месяц и Я делаю это для всех моих последовательностей, сгенерированных на основе данных (всех данных, кроме последних 30 лет).
Сначала я взял только последнее выходное значение из LSTM и перевел его в окончательный линейный результат. линейный слой, но я заметил, что он не очень хорошо сходится. Затем я расширил все выходные данные LSTM (так что для каждого месяца я получаю скрытый размер: 12 x скрытый_размер), и это работает намного лучше.
Так и с второе решение. Я не могу использовать последовательности переменной длины, но все равно не буду этого делать, верно?
Какой подход здесь будет лучшим?
import torch
import torch.nn as nn
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from torch.utils.data import DataLoader, Dataset

class LSTMDataset( Dataset ):
def __init__( self, x, y ):
self.x = x
self.y = y

def __len__(self):
return len( self.y )

def __getitem__(self, idx):
sample, label = self.x[ idx ], self.y[ idx ]
return sample.reshape( ( -1, 1 ) ), label.reshape( ( 1 ) )

class LSTMNet( nn.Module ):
def __init__( self ):
super().__init__()
self.hidden_size = 24

self.lstm = nn.LSTM( input_size=1, hidden_size=self.hidden_size, num_layers=1, batch_first=True )
self.net = nn.Sequential(
nn.Flatten(),
nn.Linear( self.hidden_size * 12, self.hidden_size * 12 ),
nn.ReLU(),
nn.Linear( self.hidden_size * 12, 1 ) # 12 is the fixed sequence length (12 months of temperature data)
)

def forward(self, x):
x, _ = self.lstm( x ) # or x[ :, -1, : ] - which one is preferred?
x = self.net( x )
return x

df = pd.read_csv( "globalTemperatures.csv" )
df = df[ [ "dt", "LandAverageTemperature" ] ]
df[ "dt" ] = pd.to_datetime( df[ "dt" ], format="%Y-%m-%d" )

forecastMonths = 12 * 30 # forecast 30 years

sequenceLength = 12 # 12 months are fed into LSTM one after another

trainX = []
trainY = []
testX = []
testY = []
for i in range( len( df ) - sequenceLength ):
x = np.array( df[ "LandAverageTemperature" ].iloc[ i : i + sequenceLength ] ).astype( np.float32 )
y = np.array( df[ "LandAverageTemperature" ].iloc[ i + sequenceLength ] ).astype( np.float32 )

if i + sequenceLength >= ( len( df ) - forecastMonths ):
testX.append( x )
testY.append( y )
else:
trainX.append( x )
trainY.append( y )

trainingSet = LSTMDataset( trainX, trainY )
testSet = LSTMDataset( testX, testY )

training_loader = DataLoader( trainingSet, batch_size=1, shuffle=True )
test_loader = DataLoader( testSet, batch_size=1, shuffle=False )

model = LSTMNet()
optimizer = torch.optim.Adam( model.parameters(), lr=0.01 )
loss_fn = torch.nn.MSELoss()

accuracies = []
epochs = 2
for epoch in range( epochs ):
losses = []
for i, data in enumerate( training_loader ):
inputs, labels = data

optimizer.zero_grad()

outputs = model(inputs)

loss = loss_fn(outputs, labels)
loss.backward()

optimizer.step()

losses.append( loss.item() )

print( f"Epoch [{epoch + 1}/{epochs}] Loss: {np.mean( losses ):.2f}" )

predictedTemperatures = []
model.eval()
for i, data in enumerate( test_loader ):
inputs, labels = data

output = model( inputs )
loss = loss_fn(outputs, labels)
losses.append( loss.item() )

predictedTemperatures.append( output.item() )

print( f"Test Loss: {np.mean( losses ):.2f}" )

plt.figure( figsize=(18, 2) )
plt.plot( df[ "dt" ], df[ "LandAverageTemperature" ], label="True Temperatures" )
plt.plot( df[ "dt" ].iloc[ -forecastMonths : ], predictedTemperatures, label="Predicted Temperatures" )
plt.savefig( "temperatures.png" )

Подробнее здесь: https://stackoverflow.com/questions/790 ... t-values-o

Реклама

1729180936

Anonymous

Я пытаюсь обучить свою первую регрессионную модель LSTM на основе данных о глобальной средней температуре. Температура доступна для каждого месяца, начиная с 1 января 1850 года.
Из того, что я узнал в Интернете, я ввожу 12 месяцев подряд в LSTM и позволяю ему прогнозировать следующий месяц и Я делаю это для всех моих последовательностей, сгенерированных на основе данных (всех данных, кроме последних 30 лет).
Сначала я взял только последнее выходное значение из LSTM и перевел его в окончательный линейный результат. линейный слой, но я заметил, что он не очень хорошо сходится. Затем я расширил все выходные данные LSTM (так что для каждого месяца я получаю скрытый размер: 12 x скрытый_размер), и это работает намного лучше.
Так и с второе решение. Я не могу использовать последовательности переменной длины, но все равно не буду этого делать, верно?
Какой подход здесь будет лучшим?
import torch
import torch.nn as nn
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from torch.utils.data import DataLoader, Dataset

class LSTMDataset( Dataset ):
def __init__( self, x, y ):
self.x = x
self.y = y

def __len__(self):
return len( self.y )

def __getitem__(self, idx):
sample, label = self.x[ idx ], self.y[ idx ]
return sample.reshape( ( -1, 1 ) ), label.reshape( ( 1 ) )

class LSTMNet( nn.Module ):
def __init__( self ):
super().__init__()
self.hidden_size = 24

self.lstm = nn.LSTM( input_size=1, hidden_size=self.hidden_size, num_layers=1, batch_first=True )
self.net = nn.Sequential(
nn.Flatten(),
nn.Linear( self.hidden_size * 12, self.hidden_size * 12 ),
nn.ReLU(),
nn.Linear( self.hidden_size * 12, 1 ) # 12 is the fixed sequence length (12 months of temperature data)
)

def forward(self, x):
x, _ = self.lstm( x ) # or x[ :, -1, : ] - which one is preferred?
x = self.net( x )
return x

df = pd.read_csv( "globalTemperatures.csv" )
df = df[ [ "dt", "LandAverageTemperature" ] ]
df[ "dt" ] = pd.to_datetime( df[ "dt" ], format="%Y-%m-%d" )

forecastMonths = 12 * 30 # forecast 30 years

sequenceLength = 12 # 12 months are fed into LSTM one after another

trainX = []
trainY = []
testX = []
testY = []
for i in range( len( df ) - sequenceLength ):
x = np.array( df[ "LandAverageTemperature" ].iloc[ i : i + sequenceLength ] ).astype( np.float32 )
y = np.array( df[ "LandAverageTemperature" ].iloc[ i + sequenceLength ] ).astype( np.float32 )

if i + sequenceLength >= ( len( df ) - forecastMonths ):
testX.append( x )
testY.append( y )
else:
trainX.append( x )
trainY.append( y )

trainingSet = LSTMDataset( trainX, trainY )
testSet = LSTMDataset( testX, testY )

training_loader = DataLoader( trainingSet, batch_size=1, shuffle=True )
test_loader = DataLoader( testSet, batch_size=1, shuffle=False )

model = LSTMNet()
optimizer = torch.optim.Adam( model.parameters(), lr=0.01 )
loss_fn = torch.nn.MSELoss()

accuracies = []
epochs = 2
for epoch in range( epochs ):
losses = []
for i, data in enumerate( training_loader ):
inputs, labels = data

optimizer.zero_grad()

outputs = model(inputs)

loss = loss_fn(outputs, labels)
loss.backward()

optimizer.step()

losses.append( loss.item() )

print( f"Epoch [{epoch + 1}/{epochs}] Loss: {np.mean( losses ):.2f}" )

predictedTemperatures = []
model.eval()
for i, data in enumerate( test_loader ):
inputs, labels = data

output = model( inputs )
loss = loss_fn(outputs, labels)
losses.append( loss.item() )

predictedTemperatures.append( output.item() )

print( f"Test Loss: {np.mean( losses ):.2f}" )

plt.figure( figsize=(18, 2) )
plt.plot( df[ "dt" ], df[ "LandAverageTemperature" ], label="True Temperatures" )
plt.plot( df[ "dt" ].iloc[ -forecastMonths : ], predictedTemperatures, label="Predicted Temperatures" )
plt.savefig( "temperatures.png" )
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79098960/pytorch-lstm-regression-take-only-last-output-value-or-take-all-output-values-o[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Регрессия Sklearn Lasso на порядок хуже, чем регрессия хребта?

Последнее сообщение Anonymous « 10 мар 2025, 01:25
Добавлено в форуме Python

Anonymous » 10 мар 2025, 01:25 » в форуме Python

В настоящее время я реализовал регрессию Ridge и Lasso с использованием модуля sklearn.linear_model .

Однако регрессия Лассо, кажется, делает на 3 порядка хуже в одном и том же наборе данных! Вот мой код:

def ridge_regression(X_train, Y_train,...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
10 мар 2025, 01:25
Регрессия Sklearn Lasso на порядок хуже, чем регрессия хребта?

Последнее сообщение Anonymous « 10 мар 2025, 05:03
Добавлено в форуме Python

Anonymous » 10 мар 2025, 05:03 » в форуме Python

В настоящее время я внедрил регрессию хребта и лассо, используя модуль sklearn.linear_model .
Однако регрессия Lasso, кажется, делает на 3 порядка хуже в одном и том же наборе данных! Вот мой код:
def ridge_regression(X_train, Y_train, X_test,...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
10 мар 2025, 05:03
Выходное значение массива равно нулю при разделении строкового значения с использованием функции implode с помощью вывод

Последнее сообщение Anonymous « 05 июл 2024, 09:55
Добавлено в форуме Php

Anonymous » 05 июл 2024, 09:55 » в форуме Php

$drstring1 = stristr($drstring, 'DR', false);
//drupal_set_message($drstring1);
$drbrkstring = $drstring1;
$drval = explode('DR', $drbrkstring);
array_shift($drval);
$drdata_array = array();
foreach ($drval as $drv) {
$drdata = process_drstring('DR'...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
05 июл 2024, 09:55
Что делает Keras, когда количество входных данных слоя LSTM больше или меньше количества ячеек LSTM в этом слое?

Последнее сообщение Anonymous « 04 ноя 2024, 15:21
Добавлено в форуме Python

Anonymous » 04 ноя 2024, 15:21 » в форуме Python

Пожалуйста, посмотрите код Python ниже. Я оставил комментарии в коде, где, по моему мнению, требуется акцент на информации.

import keras
import numpy

def build_model():
model = keras.models.Sequential()
model.add(keras.layers.LSTM(3, input_shape...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
04 ноя 2024, 15:21
Какое правило знать, сколько ячеек LSTM и сколько единиц в каждой ячейке LSTM вам нужны в керах?

Последнее сообщение Anonymous « 07 апр 2025, 23:32
Добавлено в форуме Python

Anonymous » 07 апр 2025, 23:32 » в форуме Python

Я знаю, что ячейка LSTM имеет несколько ANN внутри.

Но при определении скрытого слоя для той же проблемы я видел, как некоторые люди используют только 1 ячейку LSTM, а другие используют 2, 3 LSTM, подобные этой -

model = Sequential()...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
07 апр 2025, 23:32

Вернуться в «Python»

Programmiererforum