Как torch.einsum получает этот 4D-тензор из 3D-тензора и 2D-тензора? - Цифровое Кемерово

Как torch.einsum получает этот 4D-тензор из 3D-тензора и 2D-тензора? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как torch.einsum получает этот 4D-тензор из 3D-тензора и 2D-тензора?

Цитата

Сообщение Anonymous » 16 окт 2024, 20:02

У меня возникли проблемы с пониманием этой строки кода pytorch при чтении исходных кодов mamba_ssm. (исходный код здесь: https://github.com/state-spaces/mamba/b ... _interface. py#L121).

Код: Выделить всё

# Tensor shape
# b: batch_size, d: d_inner, l: sequence_length, n: d_state
# delta: [b,d,l]
# A: [d,n]
...
deltaA = torch.exp(torch.einsum('bdl,dn->bdln', delta, A))
...

4D-тензор deltaA рассчитывается на основе 3D-тензора delta и 2D-тензора A. Я знаю torch.einsum, но не могу понять, какие операции были выполнены для получения deltaA (объяснение) о том, как тензоры были умножены/сложены/транспонированы и т. д.)?
Я могу понять код ниже, поскольку это умножение матриц.

Код: Выделить всё

torch.einsum('bdl,dn->bln',delta,A)

Однако мне пока сложно полностью понять, что именно произошло в исходном коде. Кажется, что это связано с тензорным внешним произведением, но я не уверен.

Подробнее здесь: https://stackoverflow.com/questions/790 ... -2d-tensor

Реклама

1729098172

Anonymous

У меня возникли проблемы с пониманием этой строки кода pytorch при чтении исходных кодов mamba_ssm. (исходный код здесь: https://github.com/state-spaces/mamba/blob/6dbfc4553a98c81e1e93b8fd2d5abf387f5c09ee/mamba_ssm/ops/selective_scan_interface. py#L121).
[code]# Tensor shape
# b: batch_size, d: d_inner, l: sequence_length, n: d_state
# delta: [b,d,l]
# A: [d,n]
...
deltaA = torch.exp(torch.einsum('bdl,dn->bdln', delta, A))
...
[/code]
4D-тензор deltaA рассчитывается на основе 3D-тензора delta и 2D-тензора A. Я знаю torch.einsum, но не могу понять, какие операции были выполнены для получения deltaA (объяснение) о том, как тензоры были умножены/сложены/транспонированы и т. д.)?
Я могу понять код ниже, поскольку это умножение матриц.
[code]torch.einsum('bdl,dn->bln',delta,A)
[/code]
Однако мне пока сложно полностью понять, что именно произошло в исходном коде. Кажется, что это связано с тензорным внешним произведением, но я не уверен.
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79095106/how-does-torch-einsum-get-this-4d-tensor-from-a-3d-tensor-and-a-2d-tensor[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

RuntimeError: тензор веса должен быть определен либо для всех 1000 классов, либо ни для одного класса, но получен тензор

Последнее сообщение Anonymous « 10 ноя 2024, 15:41
Добавлено в форуме Python

Anonymous » 10 ноя 2024, 15:41 » в форуме Python

Я пытаюсь использовать VGG16 для ** набора данных из 5 классов**.
Я уже добавил 5 новых слоев, чтобы настроить вывод для logit как 5 .
model = models.vgg16(pretrained=True) #Загружает модель vgg16, предварительно обученную на наборе данных...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
10 ноя 2024, 15:41
MPI вычисляет тензор * матрицу, используя тензор, определенный глобально с использованием библиотеки Global Arrays

Последнее сообщение Anonymous « 17 дек 2024, 11:03
Добавлено в форуме C++

Anonymous » 17 дек 2024, 11:03 » в форуме C++

Я пытаюсь использовать библиотеку Global Arrays с MPI на C++, поскольку она позволяет определять переменные большого размера только один раз публично и в то же время доступны для доступа всем процессам MPI. Поэтому я создал небольшую программу,...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
17 дек 2024, 11:03
Факел: как вставить тензор в другой тензор в определенном индексе

Последнее сообщение Anonymous « 26 май 2025, 21:39
Добавлено в форуме Python

Anonymous » 26 май 2025, 21:39 » в форуме Python

Я имею мягкий тензор x с формой (b, t1, c) и мягким тензором y с формой (b, t2, c) , я также знаю длину образца l для x . Я хочу вставить образцы x в y при определенном индексе i и накладке в конце. inputs = []
for i in range(X.shape ):
input =...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
26 май 2025, 21:39
Невозможно преобразовать тензор типа устройства cuda:0 в numpy При попытке перечисления через объект torch.utils.data.Da

Последнее сообщение Anonymous « 07 ноя 2023, 09:22
Добавлено в форуме Python

Anonymous » 07 ноя 2023, 09:22 » в форуме Python

Я попытался запустить модель регрессии многослойного персептрона (MLP), написанную на PyTorch, через графический процессор в Google Colab. Однако я столкнулся с кучей ошибок при разных подходах. Ниже приведен код, который отлично работает для...

0 Ответы

79 Просмотры

Последнее сообщение Anonymous
07 ноя 2023, 09:22
Невозможно создать тензор с помощью torch.Tensor

Последнее сообщение Anonymous « 19 ноя 2024, 23:04
Добавлено в форуме Python

Anonymous » 19 ноя 2024, 23:04 » в форуме Python

Я пытался создать тензор, как показано ниже.

import torch
t = torch.tensor(2,3)

Я получил следующую ошибку.

TypeError Traceback (последний вызов последний) в ()
----> 1 a=torch.tensor(2,3)

TypeError: tensor() принимает 1 позиционный...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
19 ноя 2024, 23:04

Вернуться в «Python»

Programmiererforum