Код: Выделить всё
src_video tensor size before generation: torch.Size([3, 1, 848, 464])
src_mask tensor size before generation: torch.Size([1, 1, 848, 464])
< /code>
Это вызывает следующую ошибку, когда код пытается объединить тензоры из видео и маски: < /p>
RuntimeError: Sizes of tensors must match except in dimension 0. Expected size 3 but got size 2 for tensor number 1 in the list.
< /code>
Ошибка происходит из этой части кода: < /p>
return [torch.cat([zz, mm], dim=0) for zz, mm in zip(z, m)]
Код: Выделить всё
if src_mask is not None and src_mask[0].shape[1] == 1:
src_mask[0] = src_mask[0].expand(-1, 3, -1, -1)
print(f"DEBUG: src_mask channel expanded to 3: {src_mask[0].shape}")
Так я использую вывод:
Код: Выделить всё
python vace/vace_wan_inference.py \
--src_video assets/videos/src_video_rgb.mp4 \
--src_mask assets/videos/src_mask_rgb.mp4 \
--src_ref_images "assets/ref/hamer_61.png,assets/ref/pose_61.png" \
--prompt "重建一隻符合骨架姿勢與結構的真實人手,寫實風格,聚焦手部細節"
Подробнее здесь: https://stackoverflow.com/questions/797 ... -tensor-sh