Как улучшить стабильный диффузионный конвейер на основе контрольной сети для регенерации по положениям? - Цифровое Кемерово

Как улучшить стабильный диффузионный конвейер на основе контрольной сети для регенерации по положениям? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как улучшить стабильный диффузионный конвейер на основе контрольной сети для регенерации по положениям?

Цитата

Сообщение Anonymous » 10 июл 2025, 20:17

Я работаю над задачей, в которой я использую стабильную диффузию с Controlnet для выполнения кадрской регенерации видео кадров. /> [*] Я также имею A pose image (открытый скелет того же человека с модифицированной позой).

Я хочу сохранить исходный внешний вид, стиль и фон , но только /> Я пытаюсь регенерировать отдельные видео кадры < /strong>, используя StablediffusionControlnetimg2imgpipeline < /code> с открытым вводом в качестве управляющего ввода.

Моя цель - сохранить исходное изображение (лицо, одежда, фоновая) < /strong>, настраивая только человеческий поклон, чтобы соответствовать новому скелету. < /prilels < />> < />

Код: Выделить всё

controlnet_pose = ControlNetModel.from_pretrained(
"lllyasviel/control_v11p_sd15_openpose", torch_dtype=torch.float16
).to("cuda")

pipe = StableDiffusionControlNetImg2ImgPipeline.from_pretrained(
"runwayml/stable-diffusion-v1-5",
controlnet=controlnet_pose,
torch_dtype=torch.float16
).to("cuda")

pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config)
pipe.enable_model_cpu_offload()
pipe.enable_xformers_memory_efficient_attention()

def regenerate_frame(frame_number):
image_path = os.path.join(image_folder, f"frame_{frame_number}.png")
pose_path = os.path.join(image_folder, f"pose_{frame_number}.png")

ref_image = Image.open(image_path).convert("RGB").resize((512, 512))
pose_image = Image.open(pose_path).convert("RGB").resize((512, 512))

prompt = "same person, same style, same clothes, same background, realistic"
negative_prompt = "blurry, deformed, inconsistent face, wrong pose, bad anatomy"

try:
result = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
image=ref_image,
control_image=pose_image,
strength=0.3,
num_inference_steps=30,
guidance_scale=7.5
).images[0]
except Exception as e:
print("Error occurred:", e)
return

result.save(...)

Я ожидал, что регенерированный кадр соответствовал исходному входному рамку по внешнему виду, и только изменить pose [/b]. Но во многих случаях: < /p>

Идентичность лица не сохраняется. /> < /ul>
я попробовал: < /p>

снижение силы < /code> (до 0.2–0.4) < /p>
< /li>
gudics_scale < /code> < /p>
< /li>
< /p>
< /li li>
Но результат все еще нестабилен. < /p>
< /li>
< /ul>

Подробнее здесь: https://stackoverflow.com/questions/796 ... se-pose-co

Реклама

1752167859

Anonymous

 Я работаю над задачей, в которой я использую [b] стабильную диффузию с Controlnet [/b] для выполнения [b] кадрской регенерации [/b] видео кадров. /> [*]  Я также имею A [b] pose image [/b] (открытый скелет того же человека с модифицированной позой). 

  Я хочу [b] сохранить исходный внешний вид, стиль и фон [/b], но [b] только />  Я пытаюсь  регенерировать отдельные видео кадры < /strong>, используя StablediffusionControlnetimg2imgpipeline < /code> с открытым вводом в качестве управляющего ввода.

Моя цель -  сохранить исходное изображение (лицо, одежда, фоновая) < /strong>, настраивая только человеческий поклон, чтобы соответствовать новому скелету. < /prilels < />> < />

[code]controlnet_pose = ControlNetModel.from_pretrained(
"lllyasviel/control_v11p_sd15_openpose", torch_dtype=torch.float16
).to("cuda")

pipe = StableDiffusionControlNetImg2ImgPipeline.from_pretrained(
"runwayml/stable-diffusion-v1-5",
controlnet=controlnet_pose,
torch_dtype=torch.float16
).to("cuda")

pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config)
pipe.enable_model_cpu_offload()
pipe.enable_xformers_memory_efficient_attention()

def regenerate_frame(frame_number):
image_path = os.path.join(image_folder, f"frame_{frame_number}.png")
pose_path = os.path.join(image_folder, f"pose_{frame_number}.png")

ref_image = Image.open(image_path).convert("RGB").resize((512, 512))
pose_image = Image.open(pose_path).convert("RGB").resize((512, 512))

prompt = "same person, same style, same clothes, same background, realistic"
negative_prompt = "blurry, deformed, inconsistent face, wrong pose, bad anatomy"

try:
result = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
image=ref_image,
control_image=pose_image,
strength=0.3,
num_inference_steps=30,
guidance_scale=7.5
).images[0]
except Exception as e:
print("Error occurred:", e)
return

result.save(...)
[/code]
Я ожидал, что регенерированный кадр соответствовал исходному входному рамку по внешнему виду, и только изменить  pose [/b]. Но во многих случаях: < /p>

  Идентичность лица не сохраняется. /> < /ul>
я попробовал: < /p>

  снижение силы < /code> (до 0.2–0.4) < /p>
< /li>
  gudics_scale < /code> < /p>
< /li>
 < /p>
< /li li> 
Но результат все еще нестабилен. < /p>
< /li>
< /ul> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79695748/how-to-improve-controlnet-based-stable-diffusion-pipeline-for-frame-wise-pose-co[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Издевающийся конвейер агрегации в тесте SpringBoot завершается с ошибкой «Конвейер агрегации не должен быть нулевым»

Последнее сообщение Anonymous « 23 окт 2024, 14:25
Добавлено в форуме JAVA

Anonymous » 23 окт 2024, 14:25 » в форуме JAVA

Я работаю над тестированием агрегации MongoDB в сервисном классе Spring Boot. Тестовый класс использует Mockito для имитации операции агрегации, но при запуске теста возникает ошибка. В частности, в сообщении об ошибке говорится: «Конвейер агрегации...

0 Ответы

219 Просмотры

Последнее сообщение Anonymous
23 окт 2024, 14:25
Проблема регенерации токена CSRF при отправке формы AJAX CodeIgniter

Последнее сообщение Anonymous « 09 апр 2024, 19:06
Добавлено в форуме Php

Anonymous » 09 апр 2024, 19:06 » в форуме Php

Я работаю над приложением CodeIgniter, в котором использую защиту CSRF при отправке форм AJAX. У меня есть $config = TRUE; включен в моей конфигурации, но я сталкиваюсь с ошибкой 403 при повторной отправке формы.

Я получаю новый токен CSRF при...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
09 апр 2024, 19:06
Проблема регенерации токена CSRF при отправке формы AJAX CodeIgniter

Последнее сообщение Anonymous « 11 апр 2024, 06:57
Добавлено в форуме Php

Anonymous » 11 апр 2024, 06:57 » в форуме Php

Я работаю над приложением CodeIgniter, в котором использую защиту CSRF при отправке форм AJAX. У меня есть $config = TRUE; включен в моей конфигурации, но я сталкиваюсь с ошибкой 403 при повторной отправке формы.

Я получаю новый токен CSRF при...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
11 апр 2024, 06:57
Столкнулся с проблемой регенерации в моем приложении RAG. Когда я выбираю все источники, получаю более короткий ответ, а

Последнее сообщение Anonymous « 25 сен 2024, 15:21
Добавлено в форуме Python

Anonymous » 25 сен 2024, 15:21 » в форуме Python

Я использую модель GPT35TURBO16K в своем приложении RAG. Я использую Solr для поиска документов. Проблема в том, что когда я передаю все источники, я получаю более короткий ответ, но когда я передаю подмножество источников, я получаю длинный ответ....

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
25 сен 2024, 15:21
Как я могу создать планку регенерации пули в двигателе Python/Ursina?

Последнее сообщение Anonymous « 29 июн 2025, 19:32
Добавлено в форуме Python

Anonymous » 29 июн 2025, 19:32 » в форуме Python

Я хочу сделать планку, которая показывает такую переменную, как время регенерации пули. И я знаю, что для этого мне нужно изменить параметр масштаба, предоставленный объектам. Есть мой код:

if mermiat == False and mertim >= 0.5:
mermiat = True...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
29 июн 2025, 19:32

Вернуться в «Python»

Programmiererforum