Рекомендация о подходе, который я могу использовать для создания приложения, которое находит дубликаты изображений и бли

Рекомендация о подходе, который я могу использовать для создания приложения, которое находит дубликаты изображений и бли ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 03 окт 2024, 12:38

Я создаю приложение, которое может находить дубликаты изображений и близкие к ним дубликаты изображений из вашей библиотеки изображений.
Для моей текущей реализации я могу взять 2 изображения, извлечь из них встраивания (с помощью CLIP библиотеки), сравните ее косинусное сходство (для точных дубликатов) и евклидово расстояние (для сжатых дубликатов, таких как изображения, загруженные из чатов, или скриншоты изображения).
Любые рекомендации по следующим шагам я могу take ?Моя текущая реализация выглядит так:
main.py
from PIL import Image
import torch
import numpy as np
import cv2 as cv
import clip
from sklearn.cluster import KMeans

device = "cpu"
image_path = "assets/photos/aayush.jpeg"
image_path2 = "assets/photos/aayushResized.png"

# Load CLIP model and preprocess function
model, preprocess = clip.load("ViT-L/14", device, jit=False)

# Preprocess the images and add batch dimension
image = preprocess(Image.open(image_path)).unsqueeze(0).to(device)
image2 = preprocess(Image.open(image_path2)).unsqueeze(0).to(device)

print("The data type of images after being processed is: ", type(image))

def calculate_distance(embedding1, embedding2):
""" Calculates Euclidean Distance between 2 images """
dist = torch.nn.functional.pairwise_distance(embedding1, embedding2)
return (dist)

def calculate_cosine_similarity(embedding1, embedding2):
""" Calculates Cosine Similarity between 2 image embeddings """
return torch.nn.functional.cosine_similarity(embedding1, embedding2)

def resize_with_aspect_ratio(raw_image_path, new_width):
# Read the original image
original_image = cv.imread(raw_image_path)

# Calculate the aspect ratio
aspect_ratio = original_image.shape[1] / original_image.shape[0]

# Determine the new height based on the desired width
calculated_height = int(new_width / aspect_ratio)

# Resize the image
resized_image = cv.resize(original_image, (new_width, calculated_height))
print("Newly Resized images shape: ", resized_image.shape)
cv.imshow("Screen", resized_image)
cv.imwrite("aayushResized.png", resized_image)
cv.waitKey(0)
cv.destroyAllWindows()

return resized_image

def normalize(image):
# Compute the standard deviation for each channel
channel_stds = np.std(image, axis=(0, 1))
print(channel_stds)
# Normalize by dividing image by the channel standard deviations
normalized_image = image / channel_stds
return (normalized_image)

def clutster(image):
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto").fit(X)

# Get image embeddings from the model
with torch.no_grad():
emb1 = model.encode_image(image)
emb2 = model.encode_image(image2)

print("The data type of embeddings are: ", type(emb1), "And ", type(emb2))
# print(emb1, "\n ", emb2)

# Calculate cosine similarity between embeddings
similarity = calculate_cosine_similarity(emb1, emb2)
distance = calculate_distance(emb1, emb2)

print(f"Cosine Similarity: {similarity.item()} {type(similarity)}")
print(f"Euclidean Distance: {distance.item()} {type(similarity)}")

cluster.py
# using clustering algo[k means] to cluster the tensors together:
import os
import torch
import clip
from PIL import Image
import numpy as np
from sklearn.cluster import KMeans

device = "cpu"
model, preprocess = clip.load("ViT-L/14", device, jit=False)
# labels = ["a", "a", "a", "b", "b", "b", "c", "c", "d"]
name_list = []
np_array = []

# looping through image folder
for photos in os.listdir("assets/photos"):
image_path = os.path.join("assets/photos", photos)
# Pre processing images and getting their tensor
image = preprocess(Image.open(image_path)).unsqueeze(0).to(device)
name_list.append(photos)
# Flatten the higher dimension of tensors to like 2dim
numpyImage = np.array(image).flatten()
np_array.append(numpyImage)

k = 3
kmeans = KMeans(n_clusters=k, random_state=42)
kmeans.fit(np_array)

# getting int like labels(auto generated by KMeans)
cluster_labels = kmeans.labels_
image_cluster_map = {}
# Looping through the images and giving them labels
for i, labels in enumerate(cluster_labels):
# print(f"Image {i} belongs to cluster {labels}")
image_cluster_map[f'image_{name_list}'] = labels

# viewing our final cluster
for i, (key, value) in enumerate(image_cluster_map.items()):
print(key, " labelled as: ", value)

Подробнее здесь: https://stackoverflow.com/questions/790 ... mage-dupli

1727948337

Anonymous

Я создаю приложение, которое может находить дубликаты изображений и близкие к ним дубликаты изображений из вашей библиотеки изображений.
Для моей текущей реализации я могу взять 2 изображения, извлечь из них встраивания (с помощью CLIP библиотеки), сравните ее косинусное сходство (для точных дубликатов) и евклидово расстояние (для сжатых дубликатов, таких как изображения, загруженные из чатов, или скриншоты изображения).
Любые рекомендации по следующим шагам я могу take ?Моя текущая реализация выглядит так:
main.py
from PIL import Image
import torch
import numpy as np
import cv2 as cv
import clip
from sklearn.cluster import KMeans

device = "cpu"
image_path = "assets/photos/aayush.jpeg"
image_path2 = "assets/photos/aayushResized.png"

# Load CLIP model and preprocess function
model, preprocess = clip.load("ViT-L/14", device, jit=False)

# Preprocess the images and add batch dimension
image = preprocess(Image.open(image_path)).unsqueeze(0).to(device)
image2 = preprocess(Image.open(image_path2)).unsqueeze(0).to(device)

print("The data type of images after being processed is: ", type(image))

def calculate_distance(embedding1, embedding2):
""" Calculates Euclidean Distance between 2 images """
dist = torch.nn.functional.pairwise_distance(embedding1, embedding2)
return (dist)

def calculate_cosine_similarity(embedding1, embedding2):
"""  Calculates Cosine Similarity between 2 image embeddings """
return torch.nn.functional.cosine_similarity(embedding1, embedding2)

def resize_with_aspect_ratio(raw_image_path, new_width):
# Read the original image
original_image = cv.imread(raw_image_path)

# Calculate the aspect ratio
aspect_ratio = original_image.shape[1] / original_image.shape[0]

# Determine the new height based on the desired width
calculated_height = int(new_width / aspect_ratio)

# Resize the image
resized_image = cv.resize(original_image, (new_width, calculated_height))
print("Newly Resized images shape: ", resized_image.shape)
cv.imshow("Screen", resized_image)
cv.imwrite("aayushResized.png", resized_image)
cv.waitKey(0)
cv.destroyAllWindows()

return resized_image

def normalize(image):
# Compute the standard deviation for each channel
channel_stds = np.std(image, axis=(0, 1))
print(channel_stds)
# Normalize by dividing image by the channel standard deviations
normalized_image = image / channel_stds
return (normalized_image)

def clutster(image):
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto").fit(X)

# Get image embeddings from the model 
with torch.no_grad():
emb1 = model.encode_image(image)
emb2 = model.encode_image(image2)

print("The data type of embeddings are: ", type(emb1), "And ", type(emb2))
# print(emb1, "\n ", emb2)

# Calculate cosine similarity between embeddings
similarity = calculate_cosine_similarity(emb1, emb2)
distance = calculate_distance(emb1, emb2)

print(f"Cosine Similarity: {similarity.item()}  {type(similarity)}")
print(f"Euclidean Distance: {distance.item()} {type(similarity)}")


cluster.py
# using clustering algo[k means] to cluster the tensors together:
import os
import torch
import clip
from PIL import Image
import numpy as np
from sklearn.cluster import KMeans

device = "cpu"
model, preprocess = clip.load("ViT-L/14", device, jit=False)
# labels = ["a", "a", "a", "b", "b", "b", "c", "c", "d"]
name_list = []
np_array = []

# looping through image folder
for photos in os.listdir("assets/photos"):
image_path = os.path.join("assets/photos", photos)
# Pre processing images and getting their tensor
image = preprocess(Image.open(image_path)).unsqueeze(0).to(device)
name_list.append(photos)
# Flatten the higher dimension of tensors to like 2dim
numpyImage = np.array(image).flatten()
np_array.append(numpyImage)

k = 3
kmeans = KMeans(n_clusters=k, random_state=42)
kmeans.fit(np_array)

# getting int like labels(auto generated by KMeans)
cluster_labels = kmeans.labels_
image_cluster_map = {}
# Looping through the images and giving them labels
for i, labels in enumerate(cluster_labels):
# print(f"Image {i} belongs to cluster {labels}")
image_cluster_map[f'image_{name_list[i]}'] = labels

# viewing our final cluster
for i, (key, value) in enumerate(image_cluster_map.items()):
print(key, " labelled as: ", value)

 

Подробнее здесь: [url]https://stackoverflow.com/questions/79046818/recommendation-on-the-approach-i-can-take-to-build-an-app-that-finds-image-dupli[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Flutter: локальные уведомления Android для запуска приложения с помощью диспетчера работ / Вопрос о правильном подходе

Последнее сообщение Anonymous « 09 окт 2024, 14:39
Добавлено в форуме Android

Anonymous » 09 окт 2024, 14:39 » в форуме Android

Я работаю над кодом, который будет проверять список элементов, загружаемых из файла JSON, управляемых с помощью управления состоянием Riverpod, и отправлять локальные уведомления. Я прочитал официальную документацию по плагину локальных уведомлений....

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
09 окт 2024, 14:39
Странная рекомендация PEP8 по сравнению логических значений с True или False

Последнее сообщение Anonymous « 02 июл 2024, 23:22
Добавлено в форуме Python

Anonymous » 02 июл 2024, 23:22 » в форуме Python

В конце Python PEP 8 я читаю:

Не сравнивайте логические значения с True или False, используя ==
Yes: if greeting:
No: if greeting == True:
Worse: if greeting is True:

У меня нет проблем с этой рекомендацией, когда логическое значение...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
02 июл 2024, 23:22
Рекомендация по инструменту для тестирования и сравнения ответов API [закрыто]

Последнее сообщение Anonymous « 02 авг 2024, 20:05
Добавлено в форуме Python

Anonymous » 02 авг 2024, 20:05 » в форуме Python

Мы переносим базу данных из sqlite в DynamoDb. Миграция включает обновление кода REST API. Я ищу рекомендации по инструментам, которые я могу использовать для тестирования ответов REST API. Вариант использования, который этот инструмент должен иметь...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
02 авг 2024, 20:05
Рекомендация для очень легкой структуры веб -сайта

Последнее сообщение Anonymous « 24 янв 2025, 05:24
Добавлено в форуме Python

Anonymous » 24 янв 2025, 05:24 » в форуме Python

Я хочу обновить/переписать небольшой (10 страниц), простой веб -сайт; 8 страниц полностью статичны и могут быть записаны в HTML, 1 -й странице имеет контактную форму, а другая должна отображать фильтруемый список клубов. На данный момент сайт...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
24 янв 2025, 05:24
Рекомендация API для проконсультирования счетов SUNAT или как разработать аналогичный API [закрыто]

Последнее сообщение Anonymous « 14 мар 2025, 17:56
Добавлено в форуме Python

Anonymous » 14 мар 2025, 17:56 » в форуме Python

Я ищу API, который позволяет мне проконсультироваться с данными счетов, записанных в Sunat (Peru). В настоящее время я нашел API JSON-PE, который позволяет вам задавать запросы в качестве следующего:
Consulta FACTURA
{
GET :
credit : 25,...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
14 мар 2025, 17:56

Вернуться в «Python»