Mediapipe дает разные результаты в двух случаях: путь к файлу изображения и ввод массива numpy

Mediapipe дает разные результаты в двух случаях: путь к файлу изображения и ввод массива numpy ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Mediapipe дает разные результаты в двух случаях: путь к файлу изображения и ввод массива numpy

Цитата

Сообщение Anonymous » 25 ноя 2024, 10:36

Как вы, возможно, знаете, Mediapipe предоставляет местоположения ориентиров на основе выровненного выходного изображения, а не входного изображения.Цель:
Я собираюсь выполнить обнаружение ориентиров на нескольких изображениях. Ниже я привел код, который использует PoseLandmarkerOptions для идентификации 33 ориентиров на теле. Найдя эти ориентиры, я планирую классифицировать угол лица как 0 градусов, 90 градусов, 180 градусов или 270 градусов. .
Данные:
Я включил образцы изображений из набора данных MARS, так как не смог использовать исходные изображения из-за проблемы — они имеют более высокое разрешение и размеры по сравнению с MARS. набор данных.

[img]https://i.sstatic. net/QD1M6onZ.jpg[/img]

все изображения в сжатом виде файл:
Код:
Я предоставил основной код для обнаружения ориентиров на изображениях.

Код: Выделить всё

import sys
import cv2
import numpy as np
import glob
import os
import base64
import mediapipe as mp
from mediapipe.tasks import python
from mediapipe.tasks.python import vision
from typing import Dict

base_options = python.BaseOptions(
model_asset_path="./models/pose_landmarker.task",
delegate=python.BaseOptions.Delegate.GPU,
)

options = vision.PoseLandmarkerOptions(
base_options=base_options,
output_segmentation_masks=True,
min_pose_detection_confidence=0.5,
min_pose_presence_confidence=0.5,
min_tracking_confidence=0.5,
)
detector = vision.PoseLandmarker.create_from_options(options)

def check_landmarks(detection_result, img, address):
file_name = address.split("/")[-1]
w, h, _ = img.shape
for each_person_pose in detection_result.pose_landmarks:
for each_key_point in each_person_pose:
if each_key_point.presence > 0.5 and each_key_point.visibility > 0.5:
x_px = int(each_key_point.x * h)
y_px = int(each_key_point.y * w)
cv2.circle(img, (x_px, y_px), 3, (255, 0, 0), 2)
cv2.imwrite("./landmarks/" + file_name, img)

def rectifier(detector, image, address):
try:
srgb_image = mp.Image.create_from_file(address)
detection_result = detector.detect(srgb_image)
check_landmarks(detection_result, srgb_image.numpy_view(), address)
except Exception as e:
print(f"error {e}")

def rectify_image(rectify_image_request):
image = cv2.imdecode(
np.frombuffer(base64.b64decode(rectify_image_request["image"]), np.byte),
cv2.IMREAD_COLOR,
)
rectifier(detector, image, rectify_image_request["address"])

def read_image_for_rectify(address: str) -> Dict:
face_object = dict()
img = cv2.imread(address)
_, buffer = cv2.imencode(".jpg", img)
img = base64.b64encode(buffer).decode()
face_object["image"] = img
face_object["address"] = address
return face_object

folder_path = "./png2jpg"
file_paths = glob.glob(os.path.join(folder_path, "*.jpg"), recursive=True)
for id_file, file in enumerate(file_paths):
print(id_file, file)
rectify_image(read_image_for_rectify(file))

Проблема:
Изначально я использовал адреса изображений для подачи изображений напрямую в Mediapipe, и результаты показали приемлемую производительность. .

< /p>
Однако теперь мне нужно получать изображения в виде словарей с изображениями, закодированными в base64. Я соответствующим образом изменил входные данные, но при просмотре выходных данных в этом сценарии Mediapipe не может обнаружить ориентиры на многих изображениях. Поэтому я передаю изображения в виде массива numpy в медиапайп, изменив эту строку на

Код: Выделить всё

srgb_image = mp.Image.create_from_file(address)

Код: Выделить всё

srgb_image = mp.Image(image_format=mp.ImageFormat.SRGB, data=image)

выход во втором сценарии:

Как добиться согласованного результата в обоих сценариях?

Подробнее здесь: https://stackoverflow.com/questions/792 ... py-array-i

1732520194

Anonymous

Как вы, возможно, знаете, [b]Mediapipe[/b] предоставляет местоположения ориентиров на основе [b]выровненного выходного изображения[/b], а не [b]входного изображения[/b].[b]Цель[/b]:
Я собираюсь выполнить [b]обнаружение ориентиров[/b] на нескольких изображениях. Ниже я привел код, который использует PoseLandmarkerOptions для идентификации [b]33 ориентиров на теле[/b]. Найдя эти ориентиры, я планирую классифицировать угол лица как [b]0 градусов[/b], [b]90 градусов[/b], [b]180 градусов[/b] или [b]270 градусов. [/b].
[b]Данные[/b]:
Я включил образцы изображений из набора данных MARS, так как не смог использовать исходные изображения из-за проблемы — они имеют более высокое разрешение и размеры по сравнению с MARS. набор данных.
[img]https://i.sstatic.net/QsMETm8n.jpg[/img]
[img]https://i.sstatic.net/UD4aiLUE.jpg[/img]
[img]https://i.sstatic.net/f5OxKTv6.jpg[/img]

[img]https://i.sstatic.net/XBuQtHcg.jpg[/img]
[img]https://i.sstatic. net/QD1M6onZ.jpg[/img]
[img]https://i.sstatic.net/JLwyOJ2C.jpg[/img]
[img]https://i.sstatic.net/A2My11Y8.jpg[/img]
[img]https://i.sstatic.net/LhAHwOCd. jpg[/img]
[img]https://i.sstatic.net/2cUBzFM6.jpg[/img]

все изображения в сжатом виде файл:
Код:
Я предоставил основной код для обнаружения ориентиров на изображениях.
[code]import sys
import cv2
import numpy as np
import glob
import os
import base64
import mediapipe as mp
from mediapipe.tasks import python
from mediapipe.tasks.python import vision
from typing import Dict

base_options = python.BaseOptions(
model_asset_path="./models/pose_landmarker.task",
delegate=python.BaseOptions.Delegate.GPU,
)

options = vision.PoseLandmarkerOptions(
base_options=base_options,
output_segmentation_masks=True,
min_pose_detection_confidence=0.5,
min_pose_presence_confidence=0.5,
min_tracking_confidence=0.5,
)
detector = vision.PoseLandmarker.create_from_options(options)

def check_landmarks(detection_result, img, address):
file_name = address.split("/")[-1]
w, h, _ = img.shape
for each_person_pose in detection_result.pose_landmarks:
for each_key_point in each_person_pose:
if each_key_point.presence > 0.5 and each_key_point.visibility > 0.5:
x_px = int(each_key_point.x * h)
y_px = int(each_key_point.y * w)
cv2.circle(img, (x_px, y_px), 3, (255, 0, 0), 2)
cv2.imwrite("./landmarks/" + file_name, img)

def rectifier(detector, image, address):
try:
srgb_image = mp.Image.create_from_file(address)
detection_result = detector.detect(srgb_image)
check_landmarks(detection_result, srgb_image.numpy_view(), address)
except Exception as e:
print(f"error {e}")

def rectify_image(rectify_image_request):
image = cv2.imdecode(
np.frombuffer(base64.b64decode(rectify_image_request["image"]), np.byte),
cv2.IMREAD_COLOR,
)
rectifier(detector, image, rectify_image_request["address"])

def read_image_for_rectify(address: str) -> Dict:
face_object = dict()
img = cv2.imread(address)
_, buffer = cv2.imencode(".jpg", img)
img = base64.b64encode(buffer).decode()
face_object["image"] = img
face_object["address"] = address
return face_object

folder_path = "./png2jpg"
file_paths = glob.glob(os.path.join(folder_path, "*.jpg"), recursive=True)
for id_file, file in enumerate(file_paths):
print(id_file, file)
rectify_image(read_image_for_rectify(file))
[/code]
[b]Проблема[/b]:
Изначально я использовал адреса изображений для [b]подачи изображений напрямую[/b] в Mediapipe, и результаты показали приемлемую производительность.  .
[img]https://i.sstatic.net/6FHiTEBM.jpg[/img]
[img]https://i.sstatic.net/IYRHHjVW.jpg[/img]
[img]https://i.sstatic.net/AJcqFpX8.jpg[/img]

[img]https://i.sstatic.net/Du6F6Q4E.jpg[/img]
[img]https://i.sstatic.net/H3R3Ez9O.jpg[/img]
[img]https://i.sstatic.net/ObQJKu18.jpg[/img]

[img]https://i.sstatic.net/1KqrHFA3.jpg[/img]
[img]https://i.sstatic.net/lQVwwLP9.jpg[/img]
[img]https://i.sstatic.net/WxLHUNLw.jpg[/img]
< /p>
Однако теперь мне нужно получать изображения в виде словарей с изображениями, закодированными в [b]base64[/b]. Я соответствующим образом изменил входные данные, но при просмотре выходных данных в этом сценарии Mediapipe не может обнаружить ориентиры на многих изображениях. Поэтому я передаю изображения в виде [b]массива numpy[/b] в медиапайп, изменив эту строку на
[code]srgb_image = mp.Image.create_from_file(address)
[/code]
в
[code]srgb_image = mp.Image(image_format=mp.ImageFormat.SRGB, data=image)
[/code]
выход во втором сценарии:
[img]https://i.sstatic.net/UA87ocED. jpg[/img]
[img]https://i.sstatic.net/vDZG2Mo7.jpg[/img]
[img]https://i.sstatic.net/cWnp390g.jpg[/img]
[img]https://i.sstatic.net/9QA4fR7K.jpg[/img]

[img]https://i.sstatic.net/BHZ1GfYz.jpg[/img]
[img]https://i.sstatic.net/LhgZCxAd.jpg[/img]
[img]https://i.sstatic.net/BlJQZYzu.jpg[/img]

[img]https://i.sstatic.net/FyHKEueV.jpg[/img]
[img]https://i.sstatic.net/M60G4agp.jpg[/img]

Как добиться согласованного результата в обоих сценариях? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79220232/mediapipe-gives-different-results-in-two-cases-image-file-path-and-numpy-array-i[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Mediapipe дает разные результаты в двух случаях: путь к файлу изображения и ввод массива numpy

Последнее сообщение Anonymous « 24 ноя 2024, 17:33
Добавлено в форуме Python

Anonymous » 24 ноя 2024, 17:33 » в форуме Python

Как вы, возможно, знаете, Mediapipe предоставляет местоположения ориентиров на основе выровненного выходного изображения , а не входного изображения . Цель :
Я собираюсь выполнить обнаружение ориентиров на нескольких изображениях. Ниже я привел код,...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
24 ноя 2024, 17:33
Mediapipe дает разные результаты в двух случаях: путь к файлу изображения и ввод массива numpy

Последнее сообщение Anonymous « 26 ноя 2024, 07:46
Добавлено в форуме Python

Anonymous » 26 ноя 2024, 07:46 » в форуме Python

Как вы, возможно, знаете, Mediapipe предоставляет местоположения ориентиров на основе выровненного выходного изображения , а не входного изображения . Цель :
Я собираюсь выполнить обнаружение ориентиров на нескольких изображениях. Ниже я привел код,...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
26 ноя 2024, 07:46
Почему некоторые считают, что «нулевая копия» является лучшим выбором, чем «асинхронный ввод-ввод-ввод + прямой ввод-выв

Последнее сообщение Anonymous « 01 фев 2025, 17:28
Добавлено в форуме Linux

Anonymous » 01 фев 2025, 17:28 » в форуме Linux

Я изучаю методы передачи файлов и их влияние на производительность для различных размеров файлов. Идеально, поскольку они избегают ненужных копий данных и улучшают производительность, устраняя передачи памяти пользовательского пространства. Они...

0 Ответы

79 Просмотры

Последнее сообщение Anonymous
01 фев 2025, 17:28
MediaPipe Module разрешает неправильный путь к файлу .task

Последнее сообщение Anonymous « 23 июл 2025, 12:05
Добавлено в форуме Python

Anonymous » 23 июл 2025, 12:05 » в форуме Python

Я следую за документацией, но BaseOptions , похоже, неправильно разрешает путь модели-вместо использования моего каталога проекта он придает путь пакета Python.base_options = BaseOptions(model_asset_path='hand_landmarker.task')
options =...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
23 июл 2025, 12:05
В каких случаях эти фрагменты PHP 8.1 могут давать разные результаты?

Последнее сообщение Anonymous « 18 дек 2024, 17:49
Добавлено в форуме Php

Anonymous » 18 дек 2024, 17:49 » в форуме Php

Я решаю проблему, из-за которой этот код phpunit 10 дает разные результаты. Я запускаю это на PHP 8.1.
public function testFoo(): void {
$obj = self::createObj();

$sub = self::createSubObj();
$obj->bar->add($sub);

$obj->save();
}

И:
public...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
18 дек 2024, 17:49

Вернуться в «Python»