RuntimeError в Torch.CAT во время Vace-WAN2.1 Вывод: несоответствие формы маски и видео-тензора

RuntimeError в Torch.CAT во время Vace-WAN2.1 Вывод: несоответствие формы маски и видео-тензора ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

RuntimeError в Torch.CAT во время Vace-WAN2.1 Вывод: несоответствие формы маски и видео-тензора

Цитата

Сообщение Anonymous » 05 авг 2025, 11:47

Я использую модель генерации видео WAN2.1-Vace, и во время вывода я столкнулся с выполнением RuntimeError , связанной с несоответствующими фигурами тензора в Torch.cat Внутри vace_latent () .

Код: Выделить всё

src_video tensor size before generation: torch.Size([3, 1, 848, 464])
src_mask  tensor size before generation: torch.Size([1, 1, 848, 464])
< /code>
Это вызывает следующую ошибку, когда код пытается объединить тензоры из видео и маски: < /p>
RuntimeError: Sizes of tensors must match except in dimension 0. Expected size 3 but got size 2 for tensor number 1 in the list.
< /code>
Ошибка происходит из этой части кода: < /p>
return [torch.cat([zz, mm], dim=0) for zz, mm in zip(z, m)]

Похоже, что количество пакетов/кадров вдоль dim = 0 не совпадает между видео и маской, но я не уверен, как исправить это правильно или какая должна быть ожидаемая форма ввода. Вот что я сделал: < /p>

Код: Выделить всё

if src_mask is not None and src_mask[0].shape[1] == 1:
src_mask[0] = src_mask[0].expand(-1, 3, -1, -1)
print(f"DEBUG: src_mask channel expanded to 3: {src_mask[0].shape}")

Я ожидал, что это сделало бы маску и видео входы иметь соответствующие размеры каналов (оба с формой [3, 1, H, W] ), поэтому модель могла объединить их без ошибок. Тем не менее, я все еще получил одинаковое время выполнения во время torch.cat , жалуясь на несоответствие размеров вдоль измерения 0.
Так я использую вывод:

Код: Выделить всё

python vace/vace_wan_inference.py \
--src_video assets/videos/src_video_rgb.mp4 \
--src_mask assets/videos/src_mask_rgb.mp4 \
--src_ref_images "assets/ref/hamer_61.png,assets/ref/pose_61.png" \
--prompt "重建一隻符合骨架姿勢與結構的真實人手，寫實風格，聚焦手部細節"

Кажется, что количество кадров или какого-либо измерения все еще не смещено, но я не уверен, должен ли я расширять размер партии/кадра или просто канал.

Подробнее здесь: https://stackoverflow.com/questions/797 ... -tensor-sh

1754383647

Anonymous

 Я использую модель генерации видео WAN2.1-Vace, и во время вывода я столкнулся с выполнением RuntimeError , связанной с несоответствующими фигурами тензора в Torch.cat  Внутри vace_latent () .[code]src_video tensor size before generation: torch.Size([3, 1, 848, 464])
src_mask  tensor size before generation: torch.Size([1, 1, 848, 464])
< /code>
Это вызывает следующую ошибку, когда код пытается объединить тензоры из видео и маски: < /p>
RuntimeError: Sizes of tensors must match except in dimension 0. Expected size 3 but got size 2 for tensor number 1 in the list.
< /code>
Ошибка происходит из этой части кода: < /p>
return [torch.cat([zz, mm], dim=0) for zz, mm in zip(z, m)]
[/code]
Похоже, что количество пакетов/кадров вдоль dim = 0 не совпадает между видео и маской, но я не уверен, как исправить это правильно или какая должна быть ожидаемая форма ввода. Вот что я сделал: < /p>
[code]if src_mask is not None and src_mask[0].shape[1] == 1:
src_mask[0] = src_mask[0].expand(-1, 3, -1, -1)
print(f"DEBUG: src_mask channel expanded to 3: {src_mask[0].shape}")
[/code]
Я ожидал, что это сделало бы маску и видео входы иметь соответствующие размеры каналов (оба с формой [3, 1, H, W] ), поэтому модель могла объединить их без ошибок. Тем не менее, я все еще получил одинаковое время выполнения  во время torch.cat , жалуясь на несоответствие размеров вдоль измерения 0. 
Так я использую вывод: 
[code]python vace/vace_wan_inference.py \
--src_video assets/videos/src_video_rgb.mp4 \
--src_mask assets/videos/src_mask_rgb.mp4 \
--src_ref_images "assets/ref/hamer_61.png,assets/ref/pose_61.png" \
--prompt "重建一隻符合骨架姿勢與結構的真實人手，寫實風格，聚焦手部細節"
[/code]
Кажется, что количество кадров или какого-либо измерения все еще не смещено, но я не уверен, должен ли я расширять размер партии/кадра или просто канал.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79725054/runtimeerror-in-torch-cat-during-vace-wan2-1-inference-mask-and-video-tensor-sh[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

RuntimeError в Torch.CAT во время Vace-WAN2.1 Вывод: несоответствие формы маски и видео-тензора

Последнее сообщение Anonymous « 05 авг 2025, 11:47
Добавлено в форуме Python

Anonymous » 05 авг 2025, 11:47 » в форуме Python

Я использую модель генерации видео WAN2.1-Vace, и во время вывода я столкнулся с выполнением RuntimeError , связанной с несоответствующими фигурами тензора в Torch.cat Внутри vace_latent () . src_video tensor size before generation: torch.Size( )...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
05 авг 2025, 11:47
RuntimeError в Torch.CAT во время Vace-WAN2.1 Вывод: несоответствие формы маски и видео-тензора

Последнее сообщение Anonymous « 08 авг 2025, 11:26
Добавлено в форуме Python

Anonymous » 08 авг 2025, 11:26 » в форуме Python

Я использую модель генерации видео WAN2.1-Vace, и во время вывода я столкнулся с выполнением RuntimeError , связанной с несоответствующими фигурами тензора в Torch.cat Внутри vace_latent () . src_video tensor size before generation: torch.Size( )...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
08 авг 2025, 11:26
RuntimeError в Torch.CAT во время Vace-WAN2.1 Вывод: несоответствие формы маски и видео-тензора

Последнее сообщение Anonymous « 10 авг 2025, 05:35
Добавлено в форуме Python

Anonymous » 10 авг 2025, 05:35 » в форуме Python

Я использую модель генерации видео WAN2.1-Vace, и во время вывода я столкнулся с выполнением RuntimeError , связанной с несоответствующими фигурами тензора в Torch.cat Внутри vace_latent () . src_video tensor size before generation: torch.Size( )...

0 Ответы

0 Просмотры

Последнее сообщение Anonymous
10 авг 2025, 05:35
Как torch.einsum получает этот 4D-тензор из 3D-тензора и 2D-тензора?

Последнее сообщение Anonymous « 16 окт 2024, 20:02
Добавлено в форуме Python

Anonymous » 16 окт 2024, 20:02 » в форуме Python

У меня возникли проблемы с пониманием этой строки кода pytorch при чтении исходных кодов mamba_ssm. (исходный код здесь: py#L121).
# Tensor shape
# b: batch_size, d: d_inner, l: sequence_length, n: d_state
# delta:
# A:
...
deltaA =...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
16 окт 2024, 20:02
Как такое возможно, что цепочка команд, оканчивающаяся на `cat`, ничего не печатает, но повторное выполнение `cat в том

Последнее сообщение Anonymous « 18 окт 2024, 17:02
Добавлено в форуме Linux

Anonymous » 18 окт 2024, 17:02 » в форуме Linux

Я запускаю следующую последовательность команд:
grep -Fxv sudo: myname : 1 incorrect password attempt ; TTY=pts/3 ; PWD=/home/myname/workspace ; USER=root ; COMMAND=/usr/bin/pip uninstall ansible ~/.log-scanner/blacklist > temp && mv temp...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
18 окт 2024, 17:02

Вернуться в «Python»