Точно настроенная модель IP-адаптера не дает эффективных результатов.

Точно настроенная модель IP-адаптера не дает эффективных результатов. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Точно настроенная модель IP-адаптера не дает эффективных результатов.

Цитата

Сообщение Anonymous » 21 янв 2025, 06:08

Среда тонкой настройки основана на открытом исходном коде и его инструкциях:
https://github.com/tencent-ailab/IP-Adapter
Я обучил Модель IP-адаптера для точной настройки с использованием пар изображение + подсказка в качестве обучающих данных. Однако точно настроенная модель не отражает ожидаемый результат на основе подсказки.
2 случая неудачи для изображений поезда и файла подсказки .json:

Тот же запрос для изображений при дневном свете (17 изображений):
Например, «image_file»: «day_1.jpg», «text»: «Город в дневное время при солнечном свете».
То же самое приглашение для ночные изображения (17 изображений):
Например, «image_file»: «night_1.jpg», «text»: «Ночной город с освещением. Никакого солнечного света».
Результат вывода: После тренировки введите дневные изображения с подсказкой, например «Город в дневное время с солнечным светом». для вывода сгенерированные выходные изображения представляют собой неподвижные дневные изображения, а не ночные.
Обучайтесь на тысячах изображений (1500 нейтральных лиц и 2500 грустных). изображения лиц):
4 различных запроса на нейтральные изображения, обозначающие нейтральное выражение лица.
Например,
Код: Выделить всё
```
"image_file": "neu_1.jpg", "text": "The person's face has a neutral expression."
```
4 разных запроса к грустным изображениям, обозначающим грустное выражение лица.
Например,
Код: Выделить всё
```
"image_file": "sad_1.jpg", "text": "The person is showing a sorrowful expression."
```

Результат вывода: после тренировки примените нейтральные изображения с подсказкой, например: «Мужчина очень грустно.» или «У человека печальное выражение лица». , созданные выходные изображения лиц по-прежнему нейтральны и совсем не грустны.
Этапы точной настройки:

Измените код в файле Tutorial_train_plus.py:
замените Accelerator.save_state(save_path)
на Accelerator.save_state(save_path, Safe_serialization=False)
Для точной настройки запустите приведенные ниже сценарии:
accelerate запуск --num_processes 2 --multi_gpu --mixed_precision "fp16"

tutorial_train_plus.py

--pretrained_model_name_or_path="stable-diffusion-v1-5/"

--pretrained_ip_adapter_path="models/ip-adapter-plus_sd15.bin"

--image_encoder_path ="models/image_encoder/"

--data_json_file="assets/prompt_image.json"

--data_root_path="assets/images/train/"

--mixed_precision="fp16"

--разрешение=512

--train_batch_size=8

--dataloader_num_workers=4

--learning_rate=1e-04

--weight_decay=0,01

--output_dir="out_model"

--num_train_epochs=300

--save_steps=200
См. инструкции в readme и преобразуйте pytorch.bin в ip-adapter.bin.
В файле вывода
Код: Выделить всё
```
ip_adapter-plus_demo.py
```
,
Измените исходную модель: ip_ckpt = "models/ip-adapter-plus_sd15.bin"

к обученной модели ip_ckpt = "models/ip-adapter.bin"
запустить python3 ip_adapter-plus_demo.py для вывода

Что-то не так в описанном выше процессе или проблема во входных изображениях или подсказках?В моем случае, сколько пар наборов данных (одно изображение и одно приглашение) обычно требуется, как минимум, для достижения эффективных результатов?

Подробнее здесь: https://stackoverflow.com/questions/793 ... ve-results

1737428889

Anonymous

Среда тонкой настройки основана на открытом исходном коде и его инструкциях:
https://github.com/tencent-ailab/IP-Adapter
Я обучил Модель IP-адаптера для точной настройки с использованием пар изображение + подсказка в качестве обучающих данных. Однако точно настроенная модель не отражает ожидаемый результат на основе подсказки.
2 случая неудачи для изображений поезда и файла подсказки .json:
[list]
[*]Тот же запрос для изображений при дневном свете (17 изображений):
Например, «image_file»: «day_1.jpg», «text»: «Город в дневное время при солнечном свете». 
То же самое приглашение для ночные изображения (17 изображений):
Например, «image_file»: «night_1.jpg», «text»: «Ночной город с освещением. Никакого солнечного света».
Результат вывода: После тренировки введите дневные изображения с подсказкой, например «Город в дневное время с солнечным светом». для вывода сгенерированные выходные изображения представляют собой неподвижные дневные изображения, а не ночные.

[*]Обучайтесь на тысячах изображений (1500 нейтральных лиц и 2500 грустных). изображения лиц):
4 различных запроса на нейтральные изображения, обозначающие нейтральное выражение лица.
Например,[code]"image_file": "neu_1.jpg", "text": "The person's face has a neutral expression."[/code]
4 разных запроса к грустным изображениям, обозначающим грустное выражение лица.
Например,[code]"image_file": "sad_1.jpg", "text": "The person is showing a sorrowful expression."[/code]

[/list]
Результат вывода: после тренировки примените нейтральные изображения с подсказкой, например: «Мужчина очень грустно.» или «У человека печальное выражение лица». , созданные выходные изображения лиц по-прежнему нейтральны и совсем не грустны.
Этапы точной настройки:
[list]
[*] Измените код в файле Tutorial_train_plus.py:
замените Accelerator.save_state(save_path)
на Accelerator.save_state(save_path, Safe_serialization=False)

[*]Для точной настройки запустите приведенные ниже сценарии:
accelerate запуск --num_processes 2 --multi_gpu --mixed_precision "fp16"

tutorial_train_plus.py

--pretrained_model_name_or_path="stable-diffusion-v1-5/"

--pretrained_ip_adapter_path="models/ip-adapter-plus_sd15.bin"

--image_encoder_path ="models/image_encoder/"

--data_json_file="assets/prompt_image.json"

--data_root_path="assets/images/train/"

--mixed_precision="fp16"

--разрешение=512

--train_batch_size=8

--dataloader_num_workers=4

--learning_rate=1e-04

--weight_decay=0,01

--output_dir="out_model"

--num_train_epochs=300

--save_steps=200

[*]См. инструкции в readme и преобразуйте pytorch.bin в ip-adapter.bin.
В файле вывода
[code]ip_adapter-plus_demo.py[/code],
Измените исходную модель: ip_ckpt = "models/ip-adapter-plus_sd15.bin"


к обученной модели ip_ckpt = "models/ip-adapter.bin"

[*]запустить python3 ip_adapter-plus_demo.py для вывода
[/list]
Что-то не так в описанном выше процессе или проблема во входных изображениях или подсказках?В моем случае, сколько пар наборов данных (одно изображение и одно приглашение) обычно требуется, как минимум, для достижения эффективных результатов? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79373102/the-finetuned-ip-adapter-model-fails-to-achieve-effective-results[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Точно настроенная модель чата Llama2 не может отвечать на вопросы из набора данных.

Последнее сообщение Anonymous « 04 июл 2024, 10:35
Добавлено в форуме Python

Anonymous » 04 июл 2024, 10:35 » в форуме Python

Я настроил llama2-chat, используя этот набор данных: celsowm/guanaco-llama2-1k1
По сути, это форк с дополнительным вопросом:

Who is Mosantos? Mosantos is vilar do teles' perkiest kid

Итак, мой код поезда был:
dataset_name =...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
04 июл 2024, 10:35
Как выполнить перекрестную проверку и поиск по сетке, если у меня есть настроенная модель ансамбля в конвейере Python

Последнее сообщение Anonymous « 07 ноя 2024, 02:00
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 02:00 » в форуме Python

Я создаю индивидуальную модель ансамбля и хотел бы выполнить перекрестную проверку и поиск по сетке в Python с помощью конвейера. Как мне это сделать?
У меня есть набор данных, содержащий веб-контент. Я хочу

Разделить контент одной веб-страницы...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 02:00
Компиляция проекта maven до более низкой версии, чем JDK, настроенная с помощью maven [закрыто]

Последнее сообщение Anonymous « 22 июн 2024, 14:50
Добавлено в форуме JAVA

Anonymous » 22 июн 2024, 14:50 » в форуме JAVA

Я пытаюсь настроить проект с конфигурацией jar с несколькими выпусками для поддержки API Java более высоких версий. В настоящее время весь код собран и выпущен с использованием Java 11. Мы хотим, чтобы пользователи с Java 22 могли использовать...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
22 июн 2024, 14:50
Как получить итерацию, переданную в функцию из итерированного списка, когда возникает настроенная ошибка TimeoutError?

Последнее сообщение Anonymous « 25 июл 2024, 00:37
Добавлено в форуме Python

Anonymous » 25 июл 2024, 00:37 » в форуме Python

Я пытаюсь настроить рабочий тайм-аут в Pebble (в принципе это работает)
from pebble import ProcessPool
from multiprocessing import Process, Pool, cpu_count
import time

def test_fn(randomNumberFromList):
# print(f'Beginnging for this number:...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
25 июл 2024, 00:37
Почему Scalene не дает результатов или дает частичные результаты на моем компьютере с Windows 10?

Последнее сообщение Anonymous « 15 окт 2024, 17:30
Добавлено в форуме Python

Anonymous » 15 окт 2024, 17:30 » в форуме Python

Я только что установил Scalene 1.5.45, и у меня уже установлены Python 3.12.0 и VS Code 1.94.2. Я использую Windows 10 на ноутбуке Dell.
Я использую приведенный ниже тестовый сценарий, представленный в этом видео примерно в 24:30, и сохранил его как...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
15 окт 2024, 17:30

Вернуться в «Python»