Проблема с запуском RNN и запуском пакета torchsummary.

Проблема с запуском RNN и запуском пакета torchsummary. ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Проблема с запуском RNN и запуском пакета torchsummary.

Цитата

Сообщение Anonymous » 26 апр 2024, 18:42

Сейчас я тренирую сеть RNN для своего приложения DGPS, измеряя широту, долготу и высоту. Вот архитектура сети:

Код: Выделить всё

# Define our network class by using the nn.module
class ResBlockMLP(nn.Module):
def __init__(self, input_size, output_size):
super(ResBlockMLP, self).__init__()
self.norm1 = nn.LayerNorm(input_size)
self.fc1 = nn.Linear(input_size, input_size//2)

self.norm2 = nn.LayerNorm(input_size//2)
self.fc2 = nn.Linear(input_size//2, output_size)

self.fc3 = nn.Linear(input_size, output_size)

self.act = nn.ELU()

def forward(self, x):
x = self.act(self.norm1(x))
skip = self.fc3(x)

x = self.act(self.norm2(self.fc1(x)))
x = self.fc2(x)

return x + skip

class RNN(nn.Module):
def __init__(self, seq_len, output_size, num_blocks=1, buffer_size=128):
super(RNN, self).__init__()

seq_data_len = seq_len * 2

self.input_mlp = nn.Sequential(nn.Linear(seq_data_len, 4 * seq_data_len),
nn.ELU(),
nn.Linear(4 * seq_data_len, 128),
nn.ELU(),)

self.rnn = nn.Linear(256, 128)

blocks = [ResBlockMLP(128, 128) for _ in range(num_blocks)]
self.res_blocks = nn.Sequential(*blocks)

self.fc_out = nn.Linear(128, output_size)
self.fc_buffer = nn.Linear(128, buffer_size)
self.act = nn.ELU()

def forward(self, input_seq, buffer_in):
input_seq = input_seq.reshape(input_seq.shape[0], -1)
input_vec = self.input_mlp(input_seq)

# Concatenate the previous step buffer
x_cat = torch.cat((buffer_in, input_vec), 1)
x = self.rnn(x_cat)

x  = self.act(self.res_blocks(x))

return self.fc_out(x), torch.tanh(self.fc_buffer(x))

Однако эта строка кода выдает ошибку:

Код: Выделить всё

data_pred, buffer = gps_rnn(seq_block, buffer)

Ошибка:

Код: Выделить всё

File D:\ProgramData\Miniconda_3.9\envs\rnn-sample-py3.9\lib\site-packages\torch\nn\modules\linear.py:114, in Linear.forward(self, input)
113 def forward(self, input: Tensor) -> Tensor:
--> 114     return F.linear(input, self.weight, self.bias)

RuntimeError: mat1 and mat2 shapes cannot be multiplied (32x126 and 1600x6400)

Кто-то посоветовал мне использовать модуль torchsummary, чтобы увидеть, как тензор проходит через вашу сеть. Я получил входную форму (32,14,2), запустив print(seq_block.size()).
Однако у меня есть проблемы с запуском модуля torchsummary:

Код: Выделить всё

from torchsummary import summary
summary(gps_rnn, (32,14,2))

Ошибка: https://pastebin.com/Lt9rZD3y
Также попробовал пакет torchinfo, поскольку он был обновлен, и вместо этого получил следующий результат:< /p>

Код: Выделить всё

from torchinfo import summary
summary(gps_rnn, input_size=(batch_size, 32, 14, 2))

Ошибка: https://pastebin.com/rmuSH0j7
Я также пробовал это решение, чтобы передать два аргумента в сводную функцию, но оно также выдает ошибка: https://pastebin.com/tma4cWyN
Редактировать: проверяя формы блоков, вот что я нашел:

Код: Выделить всё

seq_block: torch.Size([32, 14, 9])
target_seq_block: torch.Size([32, 9])
buffer: torch.Size([32, 128])
input_seq: torch.Size([32, 126])

Как мне решить эту проблему и обучить сеть? Ваша помощь очень ценится.

Подробнее здесь: https://stackoverflow.com/questions/783 ... ry-package

1714146131

Anonymous

Сейчас я тренирую сеть RNN для своего приложения DGPS, измеряя широту, долготу и высоту. Вот архитектура сети:
[code]# Define our network class by using the nn.module
class ResBlockMLP(nn.Module):
def __init__(self, input_size, output_size):
super(ResBlockMLP, self).__init__()
self.norm1 = nn.LayerNorm(input_size)
self.fc1 = nn.Linear(input_size, input_size//2)

self.norm2 = nn.LayerNorm(input_size//2)
self.fc2 = nn.Linear(input_size//2, output_size)

self.fc3 = nn.Linear(input_size, output_size)

self.act = nn.ELU()

def forward(self, x):
x = self.act(self.norm1(x))
skip = self.fc3(x)

x = self.act(self.norm2(self.fc1(x)))
x = self.fc2(x)

return x + skip

class RNN(nn.Module):
def __init__(self, seq_len, output_size, num_blocks=1, buffer_size=128):
super(RNN, self).__init__()

seq_data_len = seq_len * 2

self.input_mlp = nn.Sequential(nn.Linear(seq_data_len, 4 * seq_data_len),
nn.ELU(),
nn.Linear(4 * seq_data_len, 128),
nn.ELU(),)

self.rnn = nn.Linear(256, 128)

blocks = [ResBlockMLP(128, 128) for _ in range(num_blocks)]
self.res_blocks = nn.Sequential(*blocks)

self.fc_out = nn.Linear(128, output_size)
self.fc_buffer = nn.Linear(128, buffer_size)
self.act = nn.ELU()

def forward(self, input_seq, buffer_in):
input_seq = input_seq.reshape(input_seq.shape[0], -1)
input_vec = self.input_mlp(input_seq)

# Concatenate the previous step buffer
x_cat = torch.cat((buffer_in, input_vec), 1)
x = self.rnn(x_cat)

x  = self.act(self.res_blocks(x))

return self.fc_out(x), torch.tanh(self.fc_buffer(x))
[/code]
Однако эта строка кода выдает ошибку:
[code]data_pred, buffer = gps_rnn(seq_block, buffer)[/code]
Ошибка:
[code]File D:\ProgramData\Miniconda_3.9\envs\rnn-sample-py3.9\lib\site-packages\torch\nn\modules\linear.py:114, in Linear.forward(self, input)
113 def forward(self, input: Tensor) -> Tensor:
--> 114     return F.linear(input, self.weight, self.bias)

RuntimeError: mat1 and mat2 shapes cannot be multiplied (32x126 and 1600x6400)
[/code]
Кто-то посоветовал мне использовать модуль torchsummary, чтобы увидеть, как тензор проходит через вашу сеть. Я получил входную форму (32,14,2), запустив print(seq_block.size()).
Однако у меня есть проблемы с запуском модуля torchsummary:
[code]from torchsummary import summary
summary(gps_rnn, (32,14,2))
[/code]
Ошибка: https://pastebin.com/Lt9rZD3y
Также попробовал пакет torchinfo, поскольку он был обновлен, и вместо этого получил следующий результат:< /p>
[code]from torchinfo import summary
summary(gps_rnn, input_size=(batch_size, 32, 14, 2))
[/code]
Ошибка: https://pastebin.com/rmuSH0j7
Я также пробовал это решение, чтобы передать два аргумента в сводную функцию, но оно также выдает ошибка: https://pastebin.com/tma4cWyN
Редактировать: проверяя формы блоков, вот что я нашел:
[code]seq_block: torch.Size([32, 14, 9])
target_seq_block: torch.Size([32, 9])
buffer: torch.Size([32, 128])
input_seq: torch.Size([32, 126])
[/code]
Как мне решить эту проблему и обучить сеть? Ваша помощь очень ценится. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78391307/problem-running-rnn-and-running-torchsummary-package[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как определить параметр «input_size» torchsummary.summary (model = model.policy, input_size = (int, int, int))?

Последнее сообщение Anonymous « 14 мар 2025, 01:39
Добавлено в форуме Python

Anonymous » 14 мар 2025, 01:39 » в форуме Python

Это моя сеть CNN, напечатанная 'print (model.policy)':
CnnPolicy(
(actor): Actor(
(features_extractor): CustomCNN(
(cnn): Sequential(
(0): Conv2d(1, 32, kernel_size=(3, 3), stride=(1, 1))
(1): ReLU()
(2): Conv2d(32, 64, kernel_size=(3, 3),...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
14 мар 2025, 01:39
Почему существует разница между запуском MAME из оболочки и запуском его как подпроцесса Python?

Последнее сообщение Anonymous « 12 янв 2025, 12:10
Добавлено в форуме Python

Anonymous » 12 янв 2025, 12:10 » в форуме Python

Я пытался автоматизировать рендеринг файлов .wav из эмулятора MAME с помощью сценария Python.
Моя цель — создать небольшой веб-сайт, на который можно было бы поместить мой файл .bin и позволить сценарию + MAME обрабатывать оставайтесь в фоновом...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
12 янв 2025, 12:10
Разница между tf.clip_by_value и tf.clip_by_global_norm для RNN и как определить максимальное значение для обрезки?

Последнее сообщение Anonymous « 26 окт 2023, 09:48
Добавлено в форуме Python

Anonymous » 26 окт 2023, 09:48 » в форуме Python

Хотите понять разницу в ролях tf.clip_by_value и tf.clip_by_global_norm во время реализации градиентного отсечения в TensorFlow. Какой из них предпочтительнее и как определить максимальное значение для обрезки?

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
26 окт 2023, 09:48
Проблемы с реализацией глубокой рекуррентной нейронной сети (RNN) в TensorFlow

Последнее сообщение Anonymous « 28 фев 2024, 11:43
Добавлено в форуме Android

Anonymous » 28 фев 2024, 11:43 » в форуме Android

Я столкнулся с трудностями при обучении глубокой рекуррентной нейронной сети (RNN) с использованием TensorFlow для проекта обработки естественного языка (NLP). Моя цель — создать связный текст на основе входного набора текстовых данных.

Вот...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
28 фев 2024, 11:43
Простое обучение модели RNN

Последнее сообщение Гость « 09 мар 2024, 13:55
Добавлено в форуме Python

Гость » 09 мар 2024, 13:55 » в форуме Python

**I'm trying to run a simple RNN model using keras on Tensorflow and I'm getting an error, probably linked to the graphics card (I'm not sure). It should be noted that this code often works correctly and sometimes it gives me this error and I don't...

0 Ответы

27 Просмотры

Последнее сообщение Гость
09 мар 2024, 13:55

Вернуться в «Python»