Я подключаю модуль cross_attention для более быстрого rcnn,

Я подключаю модуль cross_attention для более быстрого rcnn, ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Я подключаю модуль cross_attention для более быстрого rcnn,

Цитата

Сообщение Anonymous » 06 ноя 2024, 04:16

import torch
import torch.nn as nn
from math import sqrt

class CalculateAttention(nn.Module):
def __init__(self):
super().__init__()

def forward(self, Q, K, V):
attention = torch.matmul(Q, torch.transpose(K, -1, -2))
attention = torch.softmax(attention / sqrt(Q.size(-1)), dim=-1)
attention = torch.matmul(attention,V)
return attention

class Multi_CrossAttention(nn.Module):
"""

"""
def __init__(self, hidden_size, all_head_size, head_num):
super().__init__()
self.hidden_size = hidden_size
self.all_head_size = all_head_size
self.num_heads = head_num
self.h_size = all_head_size // head_num

assert all_head_size % head_num == 0

#  W_q, W_k, W_v (hidden_size, all_head_size)
self.linear_q = nn.Linear(hidden_size, all_head_size, bias=False)
self.linear_k = nn.Linear(1024, all_head_size, bias=False)
self.linear_v = nn.Linear(1024, all_head_size, bias=False)
self.linear_output = nn.Linear(all_head_size, hidden_size)

#  normalization
self.norm = sqrt(all_head_size)

def print(self):
print(self.hidden_size, self.all_head_size)
print(self.linear_k, self.linear_q, self.linear_v)

def forward(self, x, y):

"""

"""
batch_size = x.size(0)
# (B, S, D) -proj-> (B, S, D) -split-> (B, S, H, W) -trans-> (B, H, S, W)

# q_s: [batch_size, num_heads, seq_length, h_size]
print(f"x device is {x.device}")
print(f"self.linear_q device is {self.linear_q.weight.device}")

q_s = self.linear_q(x).view(batch_size, -1, self.num_heads, self.h_size).transpose(1, 2)
print("1")

# k_s: [batch_size, num_heads, seq_length, h_size]
k_s = self.linear_k(y).view(batch_size, -1, self.num_heads, self.h_size).transpose(1, 2)

# v_s: [batch_size, num_heads, seq_length, h_size]
v_s = self.linear_v(y).view(batch_size, -1, self.num_heads, self.h_size).transpose(1, 2)

attention = CalculateAttention()(q_s, k_s, v_s)
# attention : [batch_size , seq_length , num_heads * h_size]
attention = attention.transpose(1, 2).contiguous().view(batch_size, -1, self.num_heads * self.h_size)

# output : [batch_size , seq_length , hidden_size]
output = self.linear_output(attention)
print(output.shape)

return output

Выше находится модуль внимания

Код: Выделить всё

 prototype_data = prototype_data.to(self.device)
cross_fearures = OrderedDict()
for key in features.keys():
B, D, W, H = features[key].shape
flatten_features = features[key].reshape(B, D, -1).to(self.device)
print(f"flatten_features device is {flatten_features.device}")
print(f"prototype_data device is {prototype_data.device}")

cross_attention = Multi_CrossAttention(flatten_features.shape[2],  W ** 2, 8)

cross_output = cross_attention(flatten_features, prototype_data)
cross_output = cross_output.reshape(cross_output.shape[0], cross_output.shape[1], W, -1)

cross_fearures[key] = cross_output
features = cross_fearures

Выше я вставил модуль внимания.
Когда я запускаю программу, я получаю следующую ошибку

Код: Выделить всё

RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu! (when checking argument for argument mat2 in method wrapper_CUDA_mm)

Я обнаружил, что вес этой части (как показано ниже) все еще приходится на процессор.

Код: Выделить всё

self.linear_q = nn.Linear(hidden_size, all_head_size, bias=False)
self.linear_k = nn.Linear(1024, all_head_size, bias=False)
self.linear_v = nn.Linear(1024, all_head_size, bias=False)
self.linear_output = nn.Linear(all_head_size, hidden_size)

Но я отправил всю модель в графический процессор,
Я не знаю, почему это происходит, может кто-нибудь мне помочь, спасибо
Теперь я не знаю, почему происходит вышеописанное, может кто-нибудь мне помочь?

Подробнее здесь: https://stackoverflow.com/questions/791 ... aster-rcnn

1730855769

Anonymous

[code]import torch
import torch.nn as nn
from math import sqrt

class CalculateAttention(nn.Module):
def __init__(self):
super().__init__()

def forward(self, Q, K, V):
attention = torch.matmul(Q, torch.transpose(K, -1, -2))
attention = torch.softmax(attention / sqrt(Q.size(-1)), dim=-1)
attention = torch.matmul(attention,V)
return attention

class Multi_CrossAttention(nn.Module):
"""

"""
def __init__(self, hidden_size, all_head_size, head_num):
super().__init__()
self.hidden_size = hidden_size
self.all_head_size = all_head_size
self.num_heads = head_num
self.h_size = all_head_size // head_num

assert all_head_size % head_num == 0

#  W_q, W_k, W_v (hidden_size, all_head_size)
self.linear_q = nn.Linear(hidden_size, all_head_size, bias=False)
self.linear_k = nn.Linear(1024, all_head_size, bias=False)
self.linear_v = nn.Linear(1024, all_head_size, bias=False)
self.linear_output = nn.Linear(all_head_size, hidden_size)

#  normalization
self.norm = sqrt(all_head_size)

def print(self):
print(self.hidden_size, self.all_head_size)
print(self.linear_k, self.linear_q, self.linear_v)

def forward(self, x, y):

"""

"""
batch_size = x.size(0)
# (B, S, D) -proj-> (B, S, D) -split-> (B, S, H, W) -trans-> (B, H, S, W)

# q_s: [batch_size, num_heads, seq_length, h_size]
print(f"x device is {x.device}")
print(f"self.linear_q device is {self.linear_q.weight.device}")

q_s = self.linear_q(x).view(batch_size, -1, self.num_heads, self.h_size).transpose(1, 2)
print("1")

# k_s: [batch_size, num_heads, seq_length, h_size]
k_s = self.linear_k(y).view(batch_size, -1, self.num_heads, self.h_size).transpose(1, 2)

# v_s: [batch_size, num_heads, seq_length, h_size]
v_s = self.linear_v(y).view(batch_size, -1, self.num_heads, self.h_size).transpose(1, 2)

attention = CalculateAttention()(q_s, k_s, v_s)
# attention : [batch_size , seq_length , num_heads * h_size]
attention = attention.transpose(1, 2).contiguous().view(batch_size, -1, self.num_heads * self.h_size)

# output : [batch_size , seq_length , hidden_size]
output = self.linear_output(attention)
print(output.shape)

return output

[/code]
Выше находится модуль внимания
[code] prototype_data = prototype_data.to(self.device)
cross_fearures = OrderedDict()
for key in features.keys():
B, D, W, H = features[key].shape
flatten_features = features[key].reshape(B, D, -1).to(self.device)
print(f"flatten_features device is {flatten_features.device}")
print(f"prototype_data device is {prototype_data.device}")

cross_attention = Multi_CrossAttention(flatten_features.shape[2],  W ** 2, 8)

cross_output = cross_attention(flatten_features, prototype_data)
cross_output = cross_output.reshape(cross_output.shape[0], cross_output.shape[1], W, -1)

cross_fearures[key] = cross_output
features = cross_fearures
[/code]
Выше я вставил модуль внимания.
Когда я запускаю программу, я получаю следующую ошибку
[code]RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu! (when checking argument for argument mat2 in method wrapper_CUDA_mm)
[/code]
Я обнаружил, что вес этой части (как показано ниже) все еще приходится на процессор.
[code]self.linear_q = nn.Linear(hidden_size, all_head_size, bias=False)
self.linear_k = nn.Linear(1024, all_head_size, bias=False)
self.linear_v = nn.Linear(1024, all_head_size, bias=False)
self.linear_output = nn.Linear(all_head_size, hidden_size)
[/code]
Но я отправил всю модель в графический процессор,
Я не знаю, почему это происходит, может кто-нибудь мне помочь, спасибо
Теперь я не знаю, почему происходит вышеописанное, может кто-нибудь мне помочь? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79161108/i-am-pluing-a-cross-attention-module-in-faster-rcnn[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ошибка обучения модели более быстрого предварительного обучения RCNN

Последнее сообщение Anonymous « 03 янв 2024, 06:21
Добавлено в форуме Python

Anonymous » 03 янв 2024, 06:21 » в форуме Python

Тензорный поток: 2.10.1 Питон 3.10.0

Предварительно обученная модель: faster_rcnn_inception_resnet_v2_640x640_coco17_tpu-8

При запуске кода

TRAINING_SCRIPT = os.path.join(paths , 'research', 'object_detection', 'model_main_tf2.py') команда =...

0 Ответы

61 Просмотры

Последнее сообщение Anonymous
03 янв 2024, 06:21
Сейчас пытаюсь открыть авторизацию в php. я подключаю пакет jwt. и у меня была специальная конечная точка для аутентифик

Последнее сообщение Гость « 12 мар 2024, 08:41
Добавлено в форуме Php

Гость » 12 мар 2024, 08:41 » в форуме Php

{
код : 401,
сообщение : Неверные учетные данные .

Я ввел адрес электронной почты и пароль для Вход в систему Проверить конечную точку. Он специализируется на авторизации и получении токена. Но он возвращает код 401.
{
code : 401,
message :...

0 Ответы

46 Просмотры

Последнее сообщение Гость
12 мар 2024, 08:41
Сейчас пытаюсь открыть авторизацию в php. Подключаю связку JWT. и у меня была специальная конечная точка для аутентифика

Последнее сообщение Гость « 12 мар 2024, 12:42
Добавлено в форуме Php

Гость » 12 мар 2024, 12:42 » в форуме Php

{
code : 401,
message : Invalid credentials.
}

I entered the email and password to Login Check endpoint. It is specialised to authorization and to take token. But it returns code 401.

Источник:

0 Ответы

28 Просмотры

Последнее сообщение Гость
12 мар 2024, 12:42
Нужна помощь в устранении ошибки на этапе обучения маски rcnn. С аннотациями bbox извлечение масок не загружается должны

Последнее сообщение Anonymous « 25 май 2024, 19:52
Добавлено в форуме Python

Anonymous » 25 май 2024, 19:52 » в форуме Python

Я пытаюсь обучить маску rcnn для диабетических заболеваний глаз для обнаружения диска зрительного нерва, но во время обучения с Epoch1/5 модель работает в течение длительного времени или в противном случае появляется ошибка типа данных bool. модель...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
25 май 2024, 19:52
Импорт пакета Attention в Keras дает ModuleNotFoundError: нет модуля с именем «внимание».

Последнее сообщение Anonymous « 02 окт 2024, 19:04
Добавлено в форуме Python

Anonymous » 02 окт 2024, 19:04 » в форуме Python

В рамках импорта я импортирую пакет AttentionLayer следующим образом:

from attention import AttentionLayer

Я получаю следующую ошибку:

ModuleNotFoundError: No module named 'attention'

Я подумал, что это может быть потому, что мне нужно...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
02 окт 2024, 19:04

Вернуться в «Python»