Работа с размытыми и блеклыми изображениями в TensorFlow 1.15.8 Обучение модели автоэнкодера

Работа с размытыми и блеклыми изображениями в TensorFlow 1.15.8 Обучение модели автоэнкодера ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Работа с размытыми и блеклыми изображениями в TensorFlow 1.15.8 Обучение модели автоэнкодера

Цитата

Сообщение Anonymous » 08 дек 2024, 20:27

Описание проблемы:
Я обучаю сверточный автокодировщик реконструкции изображений, но выходные данные модели размыты и малоконтрастны по сравнению с ожидаемыми результатами. Вот настройка:

Код: Выделить всё

Python Version: 3.7
TensorFlow Version: 1.15.8 (DirectML)
GPU: AMD Radeon RX 6700XT
Model Type: Convolutional Autoencoder

Несмотря на нормализацию и увеличение данных (поворот, регулировка яркости, переворот по горизонтали), модели с трудом удается генерировать высококачественные реконструкции. Похоже, проблема связана со сверточными слоями или функцией потерь.
Что я пробовал:

Снижение скорости обучения.
Нормализация набора данных до диапазона [0,1][0,1].
Регулировка количества фильтров в кодере и декодере.
Использование MSE в качестве функции потерь.

Вопросы:
1-) Может ли удвоение фильтров в слоях кодера/декодера помочь устранить размытость, как это делают критики GAN?
2-) Можно ли объединить потери MAE с MSE во время обучение, чтобы смягчить проблему десатурации?
3-) Существуют ли специальные архитектурные или обучающие изменения, позволяющие улучшить качество вывода и избежать размытых/блеклых результатов?
Изображения:
Входные, целевые (ожидаемые результаты) и прогнозируемые результаты прилагаются для сравнения.
Пример 1:

Пример 2:

Я был бы очень признателен за любые советы или идеи по эффективному решению этой проблемы. Заранее спасибо!

Подробнее здесь: https://stackoverflow.com/questions/792 ... del-traini

1733678853

Anonymous

[b]Описание проблемы:[/b]
Я обучаю сверточный автокодировщик реконструкции изображений, но выходные данные модели размыты и малоконтрастны по сравнению с ожидаемыми результатами. Вот настройка:
[code]Python Version: 3.7
TensorFlow Version: 1.15.8 (DirectML)
GPU: AMD Radeon RX 6700XT
Model Type: Convolutional Autoencoder
[/code]
Несмотря на нормализацию и увеличение данных (поворот, регулировка яркости, переворот по горизонтали), модели с трудом удается генерировать высококачественные реконструкции. Похоже, проблема связана со сверточными слоями или функцией потерь.
[b]Что я пробовал:[/b]
[list]
[*]Снижение скорости обучения.
[*]Нормализация набора данных до диапазона [0,1][0,1].
[*]Регулировка количества фильтров в кодере и декодере.
[*]Использование MSE в качестве функции потерь.
[/list]
[b]Вопросы:[/b]
1-) Может ли удвоение фильтров в слоях кодера/декодера помочь устранить размытость, как это делают критики GAN?
2-) Можно ли объединить потери MAE с MSE во время обучение, чтобы смягчить проблему десатурации?
3-) Существуют ли специальные архитектурные или обучающие изменения, позволяющие улучшить качество вывода и избежать размытых/блеклых результатов?
[b]Изображения:[/b]
Входные, целевые (ожидаемые результаты) и прогнозируемые результаты прилагаются для сравнения.
Пример 1: 
[img]https://i.sstatic.net/A3iH2B8J.png[/img]

Пример 2: 
[img]https://i.sstatic.net/mdOX08YD.png[/img]

Я был бы очень признателен за любые советы или идеи по эффективному решению этой проблемы. Заранее спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/79263001/addressing-blurry-and-faded-images-in-tensorflow-1-15-8-autoencoder-model-traini[/url]