Почему билинейное масштабирование изображений с помощью PIL и pytorch дает разные результаты? - Цифровое Кемерово

Почему билинейное масштабирование изображений с помощью PIL и pytorch дает разные результаты? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Почему билинейное масштабирование изображений с помощью PIL и pytorch дает разные результаты?

Цитата

Сообщение Anonymous » 16 янв 2025, 12:27

Чтобы передать изображение в сеть pytorch, мне сначала нужно уменьшить его масштаб до некоторого фиксированного размера. Сначала я сделал это с помощью метода PIL.Image.resize() с режимом интерполяции, установленным на BILINEAR. Тогда я подумал, что было бы удобнее сначала преобразовать пакет изображений в тензор pytorch, а затем использовать функцию torch.nn.functional.interpolate() для одновременного масштабирования всего тензора на графическом процессоре (также «билинейный» режим интерполяции) . Это привело к снижению точности модели, поскольку теперь при выводе тип масштабирования (факел) отличался от того, который использовался при обучении (PIL). После этого я визуально сравнил два метода уменьшения масштаба и обнаружил, что они дают разные результаты. Уменьшение размера подушки кажется более плавным. Выполняют ли эти методы внутри себя разные операции, хотя оба они билинейны? Если да, то мне также интересно, есть ли способ добиться того же результата, что и масштабирование изображения подушки с масштабированием тензора факела?

Исходное изображение (известное изображение Ленны)

Изображение в масштабе подушки:

Изображение в масштабе:

Средний канал карта абсолютной разницы:

< /p>

Демо код:

import numpy as np
from PIL import Image
import torch
import torch.nn.functional as F
from torchvision import transforms
import matplotlib.pyplot as plt

pil_to_torch = transforms.ToTensor()
res_shape = (128, 128)

pil_img = Image.open('Lenna.png')
torch_img = pil_to_torch(pil_img)

pil_image_scaled = pil_img.resize(res_shape, Image.BILINEAR)
torch_img_scaled = F.interpolate(torch_img.unsqueeze(0), res_shape, mode='bilinear').squeeze(0)

pil_image_scaled_on_torch = pil_to_torch(pil_image_scaled)
relative_diff = torch.abs((pil_image_scaled_on_torch - torch_img_scaled) / pil_image_scaled_on_torch).mean().item()
print('relative pixel diff:', relative_diff)

pil_image_scaled_numpy = pil_image_scaled_on_torch.cpu().numpy().transpose([1, 2, 0])
torch_img_scaled_numpy = torch_img_scaled.cpu().numpy().transpose([1, 2, 0])
plt.imsave('pil_scaled.png', pil_image_scaled_numpy)
plt.imsave('torch_scaled.png', torch_img_scaled_numpy)
plt.imsave('mean_diff.png', np.abs(pil_image_scaled_numpy - torch_img_scaled_numpy).mean(-1))

Python 3.6.6, требования:

cycler==0.10.0
kiwisolver==1.1.0
matplotlib==3.2.1
numpy==1.18.2
Pillow==7.0.0
pyparsing==2.4.6
python-dateutil==2.8.1
six==1.14.0
torch==1.4.0
torchvision==0.5.0

Подробнее здесь: https://stackoverflow.com/questions/609 ... nt-results

1737019672

Anonymous

Чтобы передать изображение в сеть pytorch, мне сначала нужно уменьшить его масштаб до некоторого фиксированного размера. Сначала я сделал это с помощью метода PIL.Image.resize() с режимом интерполяции, установленным на BILINEAR. Тогда я подумал, что было бы удобнее сначала преобразовать пакет изображений в тензор pytorch, а затем использовать функцию torch.nn.functional.interpolate() для одновременного масштабирования всего тензора на графическом процессоре (также «билинейный» режим интерполяции) . Это привело к снижению точности модели, поскольку теперь при выводе тип масштабирования (факел) отличался от того, который использовался при обучении (PIL). После этого я визуально сравнил два метода уменьшения масштаба и обнаружил, что они дают разные результаты. Уменьшение размера подушки кажется более плавным. Выполняют ли эти методы внутри себя разные операции, хотя оба они билинейны? Если да, то мне также интересно, есть ли способ добиться того же результата, что и масштабирование изображения подушки с масштабированием тензора факела? 

Исходное изображение (известное изображение Ленны)

Изображение в масштабе подушки:

[img]https://i.sstatic.net/WOqWj.png[/img]


Изображение в масштабе:

[img]https://i.sstatic.net/J9zhJ.png[/img]


Средний канал карта абсолютной разницы:

[img]https://i.sstatic.net/ynTQD.png[/img]
< /p>

Демо код:

import numpy as np
from PIL import Image
import torch
import torch.nn.functional as F
from torchvision import transforms
import matplotlib.pyplot as plt

pil_to_torch = transforms.ToTensor()
res_shape = (128, 128)

pil_img = Image.open('Lenna.png')
torch_img = pil_to_torch(pil_img)

pil_image_scaled = pil_img.resize(res_shape, Image.BILINEAR)
torch_img_scaled = F.interpolate(torch_img.unsqueeze(0), res_shape, mode='bilinear').squeeze(0)

pil_image_scaled_on_torch = pil_to_torch(pil_image_scaled)
relative_diff = torch.abs((pil_image_scaled_on_torch - torch_img_scaled) / pil_image_scaled_on_torch).mean().item()
print('relative pixel diff:', relative_diff)

pil_image_scaled_numpy = pil_image_scaled_on_torch.cpu().numpy().transpose([1, 2, 0])
torch_img_scaled_numpy = torch_img_scaled.cpu().numpy().transpose([1, 2, 0])
plt.imsave('pil_scaled.png', pil_image_scaled_numpy)
plt.imsave('torch_scaled.png', torch_img_scaled_numpy)
plt.imsave('mean_diff.png', np.abs(pil_image_scaled_numpy - torch_img_scaled_numpy).mean(-1))


Python 3.6.6, требования:

cycler==0.10.0
kiwisolver==1.1.0
matplotlib==3.2.1
numpy==1.18.2
Pillow==7.0.0
pyparsing==2.4.6
python-dateutil==2.8.1
six==1.14.0
torch==1.4.0
torchvision==0.5.0
 

Подробнее здесь: [url]https://stackoverflow.com/questions/60949936/why-bilinear-scaling-of-images-with-pil-and-pytorch-produces-different-results[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»