Я написал реализацию для следующей задачи: даны две матрицы A и B одинаковой формы (bs, n, m, m), я хочу оптимальным образом вычислить следующее выражение. р>
Код: Выделить всё
out = torch.log(torch.exp(A).sum(dim=1)@torch.exp(B).sum(dim=1))
Проблема в том, что при вычислении показателей степени они иногда бывают слишком большими, и я получаю переполнение.
Я знаю об этом наличие кода выражения:
Это я мог найти здесь, и это работает в обычном случае, когда сумма по dim=1 не существует. Я пытался использовать этот код для вычисления предыдущего выражения, но безуспешно. Буду признателен за любую помощь.
Подробнее здесь:
https://stackoverflow.com/questions/793 ... -exponents