Несоответствие размеров тензора в байесовском FPN с обучением с подкреплением

Несоответствие размеров тензора в байесовском FPN с обучением с подкреплением ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Несоответствие размеров тензора в байесовском FPN с обучением с подкреплением

Цитата

Сообщение Anonymous » 29 ноя 2024, 12:22

Реализую проект компьютерного зрения. В этом проекте я использовал FPN (с магистральной сетью ResNet50) и BayesianFPN. Эта сеть находится под управлением Агента обучения с подкреплением. При реализации выдается RuntimeError: размер тензора a (64) должен совпадать с размером тензора b (256) в неодноэлементном измерении 3.
< ol>
[*]Что заставило код выдать эту ошибку?
[*]Это из-за несоответствия обучающего изображения (изображение RGB) и проверочного изображения (двоичная маска)?
[*]Есть ли какие-то внутренние изменения, которые мне не хватает?

Ниже приведен код. Это класс BayesianFPNwithRL, который я хочу реализовать.
PS: Я попробовал изменить форму тензора весов. Это не сработало. Даже разжав или развернув его, этого не произошло.
ДЛЯ СПРАВКИ: Размеры изображения RGB — 1280x720 пикселей; Размеры двоичной маски: 1280x720 пикселей

Код: Выделить всё

# Bayesian FPN with RL
class BayesianFPNWithRL(nn.Module):
def __init__(self, backbone_with_fpn, rl_agent, dropout_p=0.2):
super(BayesianFPNWithRL, self).__init__()
self.backbone_with_fpn = backbone_with_fpn
self.dropout = nn.Dropout(p=dropout_p)
self.rl_agent = rl_agent

def forward(self, x, mc_samples=10, train_rl=False):

fpn_outputs = self.backbone_with_fpn(x)
keys = list(fpn_outputs.keys())
features = [fpn_outputs[key] for key in keys]

common_size = features[0].shape[2:]
features = [F.interpolate(f, size=common_size, mode="nearest") for f in features]

if not self.training:
sampled_features = []
for _ in range(mc_samples):
sampled_features.append([self.dropout(f) for f in features])
features = [
torch.mean(torch.stack([sample[i] for sample in sampled_features]), dim=0)
for i in range(len(features))
]

global_features = [f.mean(dim=(2, 3)) for f in features]
rl_input = torch.cat(global_features, dim=1)

action, log_prob = self.rl_agent.select_action(rl_input)

weights = torch.zeros(len(features), device=x.device)
weights[action] = 1.0

selected_features = sum(w * f for w, f in zip(weights, features))

if train_rl:
return selected_features, log_prob
return selected_features

if __name__ == "__main__":

resnet = resnet50(weights = ResNet50_Weights.DEFAULT)
return_layers = {
'layer1': '0',
'layer2': '1',
'layer3': '2',
'layer4': '3'
}
in_channels_list = [256, 512, 1024, 2048]
out_channels = 256
backbone_with_fpn = BackboneWithFPN(resnet, return_layers, in_channels_list, out_channels)

rl_agent = RLAgent(input_dim=1280, hidden_dim=512, action_space=4)

bayesian_fpn_rl = BayesianFPNWithRL(backbone_with_fpn, rl_agent).to('cuda')

optimizer = torch.optim.Adam(bayesian_fpn_rl.parameters(), lr=1e-4)

for epoch in range(10):
for images, ground_truth_masks in dataloader:
images, ground_truth_masks = images.to('cuda'), ground_truth_masks.to('cuda')

model_output, log_prob = bayesian_fpn_rl(images, train_rl=True)

predicted_mask = (model_output > 0.5).int()

reward = compute_reward(predicted_mask, ground_truth_masks)

loss = rl_loss(log_prob, reward)

optimizer.zero_grad()
loss.backward()
optimizer.step()

print(f"Epoch [{epoch + 1}], Loss: {loss.item():.4f}, Reward: {reward:.4f}")

Подробнее здесь: https://stackoverflow.com/questions/792 ... t-learning

1732872143

Anonymous

Реализую проект компьютерного зрения. В этом проекте я использовал FPN (с магистральной сетью ResNet50) и [b]BayesianFPN[/b]. Эта сеть находится под управлением [b]Агента обучения с подкреплением[/b]. При реализации выдается [b]RuntimeError: размер тензора a (64) должен совпадать с размером тензора b (256) в неодноэлементном измерении 3[/b].
< ol>
[*]Что заставило код выдать эту ошибку?
[*]Это из-за несоответствия обучающего изображения (изображение RGB) и проверочного изображения (двоичная маска)?
[*]Есть ли какие-то внутренние изменения, которые мне не хватает?

Ниже приведен код. Это класс BayesianFPNwithRL, который я хочу реализовать.
PS: Я попробовал изменить форму тензора весов. Это не сработало. Даже разжав или развернув его, этого не произошло.
[b]ДЛЯ СПРАВКИ:[/b] Размеры изображения RGB — 1280x720 пикселей; Размеры двоичной маски: 1280x720 пикселей
[code]
# Bayesian FPN with RL
class BayesianFPNWithRL(nn.Module):
def __init__(self, backbone_with_fpn, rl_agent, dropout_p=0.2):
super(BayesianFPNWithRL, self).__init__()
self.backbone_with_fpn = backbone_with_fpn
self.dropout = nn.Dropout(p=dropout_p)
self.rl_agent = rl_agent

def forward(self, x, mc_samples=10, train_rl=False):

fpn_outputs = self.backbone_with_fpn(x)
keys = list(fpn_outputs.keys())
features = [fpn_outputs[key] for key in keys]

common_size = features[0].shape[2:]
features = [F.interpolate(f, size=common_size, mode="nearest") for f in features]

if not self.training:
sampled_features = []
for _ in range(mc_samples):
sampled_features.append([self.dropout(f) for f in features])
features = [
torch.mean(torch.stack([sample[i] for sample in sampled_features]), dim=0)
for i in range(len(features))
]

global_features = [f.mean(dim=(2, 3)) for f in features]
rl_input = torch.cat(global_features, dim=1)

action, log_prob = self.rl_agent.select_action(rl_input)

weights = torch.zeros(len(features), device=x.device)
weights[action] = 1.0

selected_features = sum(w * f for w, f in zip(weights, features))

if train_rl:
return selected_features, log_prob
return selected_features

if __name__ == "__main__":

resnet = resnet50(weights = ResNet50_Weights.DEFAULT)
return_layers = {
'layer1': '0',
'layer2': '1',
'layer3': '2',
'layer4': '3'
}
in_channels_list = [256, 512, 1024, 2048]
out_channels = 256
backbone_with_fpn = BackboneWithFPN(resnet, return_layers, in_channels_list, out_channels)

rl_agent = RLAgent(input_dim=1280, hidden_dim=512, action_space=4)

bayesian_fpn_rl = BayesianFPNWithRL(backbone_with_fpn, rl_agent).to('cuda')

optimizer = torch.optim.Adam(bayesian_fpn_rl.parameters(), lr=1e-4)

for epoch in range(10):
for images, ground_truth_masks in dataloader:
images, ground_truth_masks = images.to('cuda'), ground_truth_masks.to('cuda')

model_output, log_prob = bayesian_fpn_rl(images, train_rl=True)

predicted_mask = (model_output > 0.5).int()

reward = compute_reward(predicted_mask, ground_truth_masks)

loss = rl_loss(log_prob, reward)

optimizer.zero_grad()
loss.backward()
optimizer.step()

print(f"Epoch [{epoch + 1}], Loss: {loss.item():.4f}, Reward: {reward:.4f}")
[/code]
[img]https://i.sstatic.net/lGFXqgA9.png[/img]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79236267/mismatch-in-tensor-dimensions-in-bayesianfpn-with-reinforcement-learning[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Несоответствие размеров тензора в байесовском FPN с обучением с подкреплением

Последнее сообщение Anonymous « 29 ноя 2024, 21:23
Добавлено в форуме Python

Anonymous » 29 ноя 2024, 21:23 » в форуме Python

Реализую проект компьютерного зрения. В этом проекте я использовал FPN (с магистральной сетью ResNet50) и BayesianFPN . Эта сеть находится под управлением агента обучения с подкреплением. При реализации мне выдается
RuntimeError: The size of...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
29 ноя 2024, 21:23
Почему обучение PyTorch RetinaNet ResNet50 FPN V2 в Google Colab с графическим процессором T4 происходит так медленно?

Последнее сообщение Anonymous « 24 янв 2025, 22:58
Добавлено в форуме Python

Anonymous » 24 янв 2025, 22:58 » в форуме Python

Я прекрасно настраиваю модель сетчатки Resnet50 FPN V2 с использованием pytorch с retinanet_resnet50_fpn_v2_weights.default. Мой набор данных имеет около 13 050 образцов обучения, и я использую Google Colab с графическим процессором T4. Тем не...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
24 янв 2025, 22:58
Ошибка выполнения: размер тензора a (170) должен соответствовать размеру тензора b (1214) в неодноэлементном измерении 1

Последнее сообщение Anonymous « 06 ноя 2023, 17:50
Добавлено в форуме Python

Anonymous » 06 ноя 2023, 17:50 » в форуме Python

Я пытаюсь использовать преобразователи аудиоспектрограмм для распознавания эмоций, но застрял на этой ошибке. я в замешательстве
что означает ошибка как решить проблему...

0 Ответы

93 Просмотры

Последнее сообщение Anonymous
06 ноя 2023, 17:50
Как torch.einsum получает этот 4D-тензор из 3D-тензора и 2D-тензора?

Последнее сообщение Anonymous « 16 окт 2024, 20:02
Добавлено в форуме Python

Anonymous » 16 окт 2024, 20:02 » в форуме Python

У меня возникли проблемы с пониманием этой строки кода pytorch при чтении исходных кодов mamba_ssm. (исходный код здесь: py#L121).
# Tensor shape
# b: batch_size, d: d_inner, l: sequence_length, n: d_state
# delta:
# A:
...
deltaA =...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
16 окт 2024, 20:02
Ошибка выполнения: размер тензора a (2488) должен соответствовать размеру тензора b (1876) в неодноэлементном измерении

Последнее сообщение Anonymous « 21 окт 2024, 10:01
Добавлено в форуме Python

Anonymous » 21 окт 2024, 10:01 » в форуме Python

Это ссылка на мой блокнот Colab:

Я работаю над точная настройка моей модели SpeechT5 для преобразования текста (технический жаргон, заданный на техническом собеседовании) в речь.
частота дискретизации установлена на 16 кГц.
Я получаю сообщение...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
21 окт 2024, 10:01

Вернуться в «Python»