https://freeimgen.com/free-image-to-image-ai/Я пытаюсь создать простое веб-приложение, которое позволит пользователям загружать изображение и преобразовывать его с помощью текстовых подсказок, аналогично бесплатному инструменту Free Image to Image AI. Этот сайт использует такие модели, как Flux AI, для получения высококачественных результатов, и я хочу воспроизвести что-то базовое локально или на сервере. Я изучил библиотеку Hugging Face Diffusers, которая поддерживает модели Flux, но у меня возникли проблемы с настройкой и скоростью вывода. Вот что я пробовал на данный момент:
python
Код: Выделить всё
import torch
from diffusers import FluxPipeline
# Load the model
pipe = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-dev", torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload() # To save VRAM
# Example usage
prompt = "Turn this into a cyberpunk cityscape"
image = pipe(prompt, init_image=original_image, strength=0.8, num_inference_steps=50).images[0]
Но я получаю такие ошибки, как «torch.bfloat16 не поддерживается на ЦП» при работе без графического процессора, а в Colab с графическим процессором это слишком медленно для использования в реальном времени. Кроме того, как мне безопасно обрабатывать загрузку изображений и обеспечивать конфиденциальность (например, удалять после обработки)? Вопросы:
- Как лучше всего настроить Flux для преобразования изображения в изображение без высокопроизводительного графического процессора? Любые оптимизации или более легкие модели?
- Как интегрировать это в приложение Flask/Django для загрузки в Интернет?
- Существуют ли бесплатные API или альтернативы Flux, которые соответствуют качеству таких инструментов?
Любые примеры кода, библиотеки (например, PyTorch, Диффузоры) или советы будут признательны! Я использую Python 3.10.
Подробнее здесь:
https://stackoverflow.com/questions/798 ... -in-python