Как использовать ONNX для обнаружения объектов с помощью пользовательской модели yolov5s? - Цифровое Кемерово

Как использовать ONNX для обнаружения объектов с помощью пользовательской модели yolov5s? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как использовать ONNX для обнаружения объектов с помощью пользовательской модели yolov5s?

Цитата

Сообщение Anonymous » 15 янв 2025, 23:11

Используя репозиторий yolov5 ultralytics, я обучил модель yolov5s обнаруживать определенные объекты, используя набор данных, аннотированный в Roboflow с одним классом объектов.
Эта модель отлично работает в репозитории Python при загрузке через концентратор горелки. Однако Torch был болезненным для упаковки зависимостей, поэтому я решил переключиться на onnx-runtime.
Я экспортировал свои веса yolo в onnx с помощью команды python3 Export.py --weights run/train/ X_v3/weights/best.pt --img 640 --batch 1 --include onnx.
Все еще в репозитории yolo я попробовал запустить python3 Detect.py --weights run/train/X_v3/weights/best.onnx --source test_image.jpg и все работает отлично. Для ясности: это test_image.jpg — одно из моих тестовых изображений из Roboflow (то есть оно было растянуто до 640 x 640, без какой-либо другой специальной предварительной обработки).
Затем я написал скрипт (см. ниже) для непосредственного тестирования onnx. Это произошло после того, как я поместил файл весов в netron.app, чтобы увидеть формат ввода и вывода.
Ограничивающая рамка вывода, нарисованная сценарием, находится непривычно далеко от реального объекта (довольно мала по сравнению с к объекту), а изображение onnx_test.png — то же самое, что я использовал в репозитории yolov5 для обнаружения. Что я упускаю?
Координаты кажутся правдоподобными. Я напечатал максимальные значения для x0, y0, x1, y1, и они составляют около 643 (что странно - yolo когда-нибудь дает координаты, выходящие за пределы размера изображения?). Я перевернул их при рисовании прямоугольника, но предполагаю, что именно так onnx выводит координаты.

Код: Выделить всё

import onnxruntime
import numpy as np
from PIL import Image, ImageDraw

# onnx expects `tensor: float32[1,3,640,640]`
image = Image.open('src/onnx_test.png')
image = image.resize((640, 640)) # convert to 640 x 640
image = image.convert('RGB') # 3 channel RGB
image_array = np.array(image).astype(np.float32)
image_array = np.transpose(image_array, (2, 0, 1)) # (height: 0, width: 1, channels: 2) -> (channels: 2, height: 0, width: 1)
image_array = np.expand_dims(image_array, axis=0) # add batch dim (1, ...)
print(image_array.shape)

session = onnxruntime.InferenceSession('src/processing/weights/v3.onnx')
input_name = session.get_inputs()[0].name
label_name = session.get_outputs()[0].name
pred_onx = session.run(
[label_name], {input_name: image_array})[0]
print(pred_onx.shape) # tensor: float32[1,25200,6]
print(np.round(
pred_onx[0][np.argmax(pred_onx[0][:, 4])],
2).tolist()) # get highest confidence inference

# OUTPUT: [357.510009765625, 247.05999755859375, 51.18000030517578, 32.560001373291016, 0.9599999785423279, 1.0]

image_draw = ImageDraw.Draw(image)
image_draw.rectangle((51, 32, 357, 247), outline ="red")
image.show()

Я ожидал увидеть ту же ограничивающую рамку, которую вижу при запуске define.py в репозитории yolov5. Однако результат намного меньше объекта и висит в верхнем левом углу изображения.

Подробнее здесь: https://stackoverflow.com/questions/793 ... ov5s-model

Реклама

1736971876

Anonymous

Используя репозиторий yolov5 ultralytics, я обучил модель yolov5s обнаруживать определенные объекты, используя набор данных, аннотированный в Roboflow с одним классом объектов.
Эта модель отлично работает в репозитории Python при загрузке через концентратор горелки. Однако Torch был болезненным для упаковки зависимостей, поэтому я решил переключиться на onnx-runtime.
Я экспортировал свои веса yolo в onnx с помощью команды python3 Export.py --weights run/train/ X_v3/weights/best.pt --img 640 --batch 1 --include onnx.
Все еще в репозитории yolo я попробовал запустить python3 Detect.py --weights run/train/X_v3/weights/best.onnx --source test_image.jpg и все работает отлично. Для ясности: это test_image.jpg — одно из моих тестовых изображений из Roboflow (то есть оно было растянуто до 640 x 640, без какой-либо другой специальной предварительной обработки).
Затем я написал скрипт (см. ниже) для непосредственного тестирования onnx. Это произошло после того, как я поместил файл весов в netron.app, чтобы увидеть формат ввода и вывода.
Ограничивающая рамка вывода, нарисованная сценарием, находится непривычно далеко от реального объекта (довольно мала по сравнению с к объекту), а изображение onnx_test.png — то же самое, что я использовал в репозитории yolov5 для обнаружения. Что я упускаю?
Координаты кажутся правдоподобными. Я напечатал максимальные значения для x0, y0, x1, y1, и они составляют около 643 (что странно - yolo когда-нибудь дает координаты, выходящие за пределы размера изображения?). Я перевернул их при рисовании прямоугольника, но предполагаю, что именно так onnx выводит координаты.
[code]import onnxruntime
import numpy as np
from PIL import Image, ImageDraw

# onnx expects `tensor: float32[1,3,640,640]`
image = Image.open('src/onnx_test.png')
image = image.resize((640, 640)) # convert to 640 x 640
image = image.convert('RGB') # 3 channel RGB
image_array = np.array(image).astype(np.float32)
image_array = np.transpose(image_array, (2, 0, 1)) # (height: 0, width: 1, channels: 2) -> (channels: 2, height: 0, width: 1)
image_array = np.expand_dims(image_array, axis=0) # add batch dim (1, ...)
print(image_array.shape)

session = onnxruntime.InferenceSession('src/processing/weights/v3.onnx')
input_name = session.get_inputs()[0].name
label_name = session.get_outputs()[0].name
pred_onx = session.run(
[label_name], {input_name: image_array})[0]
print(pred_onx.shape) # tensor: float32[1,25200,6]
print(np.round(
pred_onx[0][np.argmax(pred_onx[0][:, 4])],
2).tolist()) # get highest confidence inference

# OUTPUT: [357.510009765625, 247.05999755859375, 51.18000030517578, 32.560001373291016, 0.9599999785423279, 1.0]

image_draw = ImageDraw.Draw(image)
image_draw.rectangle((51, 32, 357, 247), outline ="red")
image.show()
[/code]
Я ожидал увидеть ту же ограничивающую рамку, которую вижу при запуске define.py в репозитории yolov5. Однако результат намного меньше объекта и висит в верхнем левом углу изображения. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79356824/how-do-i-use-onnx-to-detect-objects-using-a-custom-yolov5s-model[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ограничительные рамки обнаружения объектов с использованием yolov5s и onnx на ml.net

Последнее сообщение Anonymous « 29 апр 2024, 04:19
Добавлено в форуме C#

Anonymous » 29 апр 2024, 04:19 » в форуме C#

Я знаю, прошло много времени. Я также использую yolov5 с MAUI, но в форме ONNX. У меня нет проблем с получением прогнозов, но проблема в ограничивающих рамках, которые находятся далеко от них.
Моя модель имеет входное значение 1,3,640,640 и выходное...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
29 апр 2024, 04:19
Маска сегментации пост-обработки из модели ONNX в Интернете (Onnx Runtime JS)

Последнее сообщение Anonymous « 30 апр 2025, 10:00
Добавлено в форуме Javascript

Anonymous » 30 апр 2025, 10:00 » в форуме Javascript

В настоящее время я работаю над тем, чтобы запустить свою пользовательскую модель сегментации ONNX непосредственно в браузере, используя время выполнения ONNX для Web с HTML и JavaScript. Модель успешно загружает и выполняет вывод. Тем не менее, я...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
30 апр 2025, 10:00
Подача входных данных в модель onnx resnet18 (развертывание Resnet18 для обнаружения объектов в видеофайле)

Последнее сообщение Anonymous « 19 окт 2024, 00:47
Добавлено в форуме Python

Anonymous » 19 окт 2024, 00:47 » в форуме Python

Я создал и сохранил обученную модель resnet18, используя код в github по этой ссылке.
код можно запустить, указав каталог обучения и тип сетевой модели. >
Модель resnet18.onnx выбрана и обучена для классификации 4 типов ячеек.
Для этого проекта я...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
19 окт 2024, 00:47
Проблема с результатами обнаружения объектов в Java с использованием yolov5 onnx model

Последнее сообщение Anonymous « 21 фев 2025, 19:47
Добавлено в форуме JAVA

Anonymous » 21 фев 2025, 19:47 » в форуме JAVA

Я обучил нейронную сеть для обнаружения объектов, используя Yolov5 и экспортировал ее в формат ONNX, так как мне нужно использовать его в приложении Java. Тем не менее, я сталкиваюсь с проблемами с неправильными идентификаторами класса и...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
21 фев 2025, 19:47
Проблема с результатами обнаружения объектов в Java с использованием yolov5 onnx model

Последнее сообщение Anonymous « 22 фев 2025, 09:42
Добавлено в форуме JAVA

Anonymous » 22 фев 2025, 09:42 » в форуме JAVA

Я обучил нейронную сеть для обнаружения объектов, используя Yolov5 и экспортировал ее в формат ONNX, так как мне нужно использовать его в приложении Java. Тем не менее, я сталкиваюсь с проблемами с неправильными идентификаторами класса и...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
22 фев 2025, 09:42

Вернуться в «Python»

Programmiererforum