Постройте матрицу путаницы, например, сегментацию (маска r-cnn из детектора 2)

Постройте матрицу путаницы, например, сегментацию (маска r-cnn из детектора 2) ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Постройте матрицу путаницы, например, сегментацию (маска r-cnn из детектора 2)

Цитата

Сообщение Anonymous » 03 янв 2024, 15:45

Я обучил маску r-cnn изображениям кукурузы (не могу показать примеры, поскольку они конфиденциальны), но по сути это изображения зерен кукурузы, разбросанных по плоской поверхности.

Есть разные виды кукурузных зерен, которые я хочу сегментировать и классифицировать. Я понимаю, что метрики AP — лучший способ измерения производительности алгоритма сегментации экземпляров, и знаю, что матрица путаницы для такого алгоритма обычно не имеет смысла.

Но для его конкретного случая, когда у меня есть 4 класса очень похожих объектов, я хотел бы иметь возможность установить фиксированное значение AP, например AP50/AP75, и построить для этого матрицу путаницы.

А возможно ли это? Как бы я это сделал?

Я использовал библиотеку детекторрон2 для обучения и получения прогнозов. Вот код, который я использую для загрузки обученной модели с диска, создания прогнозов в наборе проверки и визуализации результатов:

импортировать детектор2 изDetectron2.utils.logger импортируйте setup_logger setup_logger() импортировать numpy как np импортировать matplotlib.pyplot как plt импортировать операционную систему, json, cv2, случайный, gc из детектора 2 импорта model_zoo изDetectron2.data.datasets импортировать Register_coco_instances из importon2.checkpoint импорт DetectionCheckpointer, Checkpointer изDetectron2.data импорт MetadataCatalog, DatasetCatalog, build_detection_test_loader из детектора 2.engine импортировать DefaultTrainer, DefaultPredictor из детектора 2.config импортируйте get_cfg изDetectron2.utils.visualizer импортировать визуализатор, ColorMode из детектора 2.modeling импорт build_model изDetectron2.evaluation, импорт COCOEvaluator, inference_on_dataset train_annotations_path = "./data/cvat-corn-train-coco-1.0/annotations/instances_default.json" train_images_path = "./data/cvat-corn-train-coco-1.0/images" validation_annotations_path = "./data/cvat-corn-validation-coco-1.0/annotations/instances_default.json" validation_images_path = "./data/cvat-corn-validation-coco-1.0/images" cfg = get_cfg() cfg.merge_from_file(model_zoo.get_config_file("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml")) cfg.DATASETS.TRAIN = («поезд-кукуруза»,) cfg.DATASETS.TEST = («кукуруза проверки»,) cfg.DATALOADER.NUM_WORKERS = 2 cfg.MODEL.WEIGHTS = model_zoo.get_checkpoint_url("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml") # Разрешить инициализацию обучения из зоопарка модели cfg.SOLVER.IMS_PER_BATCH = 2 cfg.SOLVER.BASE_LR = 0,00025 cfg.SOLVER.MAX_ITER = 10000 cfg.SOLVER.STEPS = [] cfg.MODEL.ROI_HEADS.BATCH_SIZE_PER_IMAGE = 128 cfg.MODEL.ROI_HEADS.NUM_CLASSES = 4 cfg.OUTPUT_DIR = "./выход" cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0,7 Register_coco_instances( «поезд-кукуруза», {}, train_annotations_path, train_images_path ) Register_coco_instances( "кукуруза проверки", {}, validation_annotations_path, validation_images_path ) Metadata_train = MetadataCatalog.get("поезд-кукуруза") dataset_dicts = DatasetCatalog.get("поезд-кукуруза") cfg.MODEL.WEIGHTS = os.path.join(cfg.OUTPUT_DIR, "model_final.pth") cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0,7 предиктор = DefaultPredictor(cfg) Predicted_images_path = os.path.abspath("./predicted/") dataset_dicts_validation = DatasetCatalog.get("проверка-кукуруза") для d в dataset_dicts_validation: im = cv2.imread(d["имя_файла"]) выходные данные = предиктор (im) v = Визуализатор(im[:, :, ::-1], метаданные = метаданные_поезд, масштаб=0,5, instance_mode=ColorMode.IMAGE_BW ) out = v.draw_instance_predictions(выходы["экземпляры"].to("процессор")) fig = plt.figure(frameon=False, dpi=1) fig.set_size_inches(1024,1024) ax = plt.Axes(рис, [0., 0., 1., 1.]) ax.set_axis_off() fig.add_axes(ax) ax.imshow(cv2.cvtColor(out.get_image()[:, :, ::-1], cv2.COLOR_BGR2RGB), аспект='авто') fig.savefig(f"{predicted_images_path}/{d['file_name'].split('/')[-1]}") Вот как выглядит мой вывод для данного изображения:

Это словарь с объектом Instances в качестве единственного значения. Объект Instances имеет четыре списка: pred_boxes, оценки, pred_classes и pred_masks. И можно визуализировать с помощью визуализатора детекторрон2, но я не могу показать визуализацию по соображениям конфиденциальности.

Вот метрики, которые у меня есть для модели на данный момент:

И для каждого класса:

И визуально я заметил, что некоторые ядра путаются с другими классами, особенно между классами ardido и Fermentado, поэтому я хочу как-то иметь возможность построить матрицу путаницы.

Я ожидаю, что матрица путаницы будет выглядеть примерно так:

РЕДАКТИРОВАТЬ: Я нашел этот репозиторий:

https://github.com/kaanakan/object_dete ... ion_matrix

И попробовал его использовать:

из запутанной_матрицы импортировать ConfusionMatrix см = ConfusionMatrix(4, CONF_THRESHOLD=0,3, IOU_THRESHOLD=0,3) для d в dataset_dicts_validation: img = cv2.imread(d["имя_файла"]) выходные данные = предиктор (img) метки = список() обнаружения = список() для Энн в d["аннотации"]: labels.append([ann["category_id"]] + ann["bbox"]) для координат, конф, cls в zip( outputs["instances"].get("pred_boxes").tensor.cpu().numpy(), выходы["экземпляры"].get("оценки").cpu().numpy(), выходы["экземпляры"].get("pred_classes").cpu().numpy() ): обнаружения.append(список(координаты) + [conf] + [cls]) cm.process_batch(np.array(обнаружения), np.array(метки)) Но матрица, которую я получил, явно неправильная, и мне трудно ее исправить.

1704285907

Anonymous


Я обучил маску r-cnn изображениям кукурузы (не могу показать примеры, поскольку они конфиденциальны), но по сути это изображения зерен кукурузы, разбросанных по плоской поверхности.
 
Есть разные виды кукурузных зерен, которые я хочу сегментировать и классифицировать. Я понимаю, что метрики AP — лучший способ измерения производительности алгоритма сегментации экземпляров, и знаю, что матрица путаницы для такого алгоритма обычно не имеет смысла.
 
Но для его конкретного случая, когда у меня есть 4 класса очень похожих объектов, я хотел бы иметь возможность установить фиксированное значение AP, например AP50/AP75, и построить для этого матрицу путаницы.
 
А возможно ли это? Как бы я это сделал?
 
Я использовал библиотеку детекторрон2 для обучения и получения прогнозов. Вот код, который я использую для загрузки обученной модели с диска, создания прогнозов в наборе проверки и визуализации результатов:
 
импортировать детектор2 изDetectron2.utils.logger импортируйте setup_logger setup_logger() импортировать numpy как np импортировать matplotlib.pyplot как plt импортировать операционную систему, json, cv2, случайный, gc из детектора 2 импорта model_zoo изDetectron2.data.datasets импортировать Register_coco_instances из importon2.checkpoint импорт DetectionCheckpointer, Checkpointer изDetectron2.data импорт MetadataCatalog, DatasetCatalog, build_detection_test_loader из детектора 2.engine импортировать DefaultTrainer, DefaultPredictor из детектора 2.config импортируйте get_cfg изDetectron2.utils.visualizer импортировать визуализатор, ColorMode из детектора 2.modeling импорт build_model изDetectron2.evaluation, импорт COCOEvaluator, inference_on_dataset train_annotations_path = "./data/cvat-corn-train-coco-1.0/annotations/instances_default.json" train_images_path = "./data/cvat-corn-train-coco-1.0/images" validation_annotations_path = "./data/cvat-corn-validation-coco-1.0/annotations/instances_default.json" validation_images_path = "./data/cvat-corn-validation-coco-1.0/images" cfg = get_cfg() cfg.merge_from_file(model_zoo.get_config_file("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml")) cfg.DATASETS.TRAIN = («поезд-кукуруза»,) cfg.DATASETS.TEST = («кукуруза проверки»,) cfg.DATALOADER.NUM_WORKERS = 2 cfg.MODEL.WEIGHTS = model_zoo.get_checkpoint_url("COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml") # Разрешить инициализацию обучения из зоопарка модели cfg.SOLVER.IMS_PER_BATCH = 2 cfg.SOLVER.BASE_LR = 0,00025 cfg.SOLVER.MAX_ITER = 10000 cfg.SOLVER.STEPS = [] cfg.MODEL.ROI_HEADS.BATCH_SIZE_PER_IMAGE = 128 cfg.MODEL.ROI_HEADS.NUM_CLASSES = 4 cfg.OUTPUT_DIR = "./выход" cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0,7 Register_coco_instances(     «поезд-кукуруза»,     {},     train_annotations_path,     train_images_path ) Register_coco_instances(     "кукуруза проверки",     {},     validation_annotations_path,     validation_images_path ) Metadata_train = MetadataCatalog.get("поезд-кукуруза") dataset_dicts = DatasetCatalog.get("поезд-кукуруза") cfg.MODEL.WEIGHTS = os.path.join(cfg.OUTPUT_DIR, "model_final.pth") cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0,7 предиктор = DefaultPredictor(cfg) Predicted_images_path = os.path.abspath("./predicted/") dataset_dicts_validation = DatasetCatalog.get("проверка-кукуруза") для d в dataset_dicts_validation:     im = cv2.imread(d["имя_файла"])     выходные данные = предиктор (im)     v = Визуализатор(im[:, :, ::-1],                    метаданные = метаданные_поезд,                    масштаб=0,5,                    instance_mode=ColorMode.IMAGE_BW     )     out = v.draw_instance_predictions(выходы["экземпляры"].to("процессор"))     fig = plt.figure(frameon=False, dpi=1)     fig.set_size_inches(1024,1024)     ax = plt.Axes(рис, [0., 0., 1., 1.])     ax.set_axis_off()     fig.add_axes(ax)     ax.imshow(cv2.cvtColor(out.get_image()[:, :, ::-1], cv2.COLOR_BGR2RGB), аспект='авто')     fig.savefig(f"{predicted_images_path}/{d['file_name'].split('/')[-1]}")  Вот как выглядит мой вывод для данного изображения: 
[img]https://i.stack.imgur.com/om4W6.png[/img]

 
Это словарь с объектом Instances в качестве единственного значения. Объект Instances имеет четыре списка: pred_boxes, оценки, pred_classes и pred_masks. И можно визуализировать с помощью визуализатора детекторрон2, но я не могу показать визуализацию по соображениям конфиденциальности.
 
Вот метрики, которые у меня есть для модели на данный момент:
 

[img]https://i.stack.imgur.com/ebnw3.png[/img]

 
И для каждого класса: 
[img]https://i.stack.imgur.com/7qfwF.png[/img]

 
И визуально я заметил, что некоторые ядра путаются с другими классами, особенно между классами ardido и Fermentado, поэтому я хочу как-то иметь возможность построить матрицу путаницы.
 
Я ожидаю, что матрица путаницы будет выглядеть примерно так: 
[img]https://i.stack.imgur.com/bIHg6.png[/img]

 
РЕДАКТИРОВАТЬ: Я нашел этот репозиторий:
 
https://github.com/kaanakan/object_detection_confusion_matrix
 
И попробовал его использовать:
 
из запутанной_матрицы импортировать ConfusionMatrix см = ConfusionMatrix(4, CONF_THRESHOLD=0,3, IOU_THRESHOLD=0,3) для d в dataset_dicts_validation:     img = cv2.imread(d["имя_файла"])     выходные данные = предиктор (img)     метки = список()     обнаружения = список()     для Энн в d["аннотации"]:         labels.append([ann["category_id"]] + ann["bbox"])     для координат, конф, cls в zip(         outputs["instances"].get("pred_boxes").tensor.cpu().numpy(),         выходы["экземпляры"].get("оценки").cpu().numpy(),         выходы["экземпляры"].get("pred_classes").cpu().numpy()     ):         обнаружения.append(список(координаты) + [conf] + [cls])     cm.process_batch(np.array(обнаружения), np.array(метки))  Но матрица, которую я получил, явно неправильная, и мне трудно ее исправить. 
[img]https://i.stack.imgur.com/jsLEB.png[/img]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Разница между входной формой для 1D CNN, 2D CNN и 3D CNN

Последнее сообщение Anonymous « 21 июл 2025, 09:35
Добавлено в форуме Python

Anonymous » 21 июл 2025, 09:35 » в форуме Python

Я впервые создаю модель CNN для классификации изображений, и я немного запутался в том, что будет формой ввода для каждого типа (1D CNN, 2D CNN, 3D CNN) и как исправить количество фильтров в слое свертки. Мои данные - 100x100x30, где 30 являются...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
21 июл 2025, 09:35
Как умножить матрицу 2x3x3x3 на матрицу 2x3, чтобы получить матрицу 2x3

Последнее сообщение Anonymous « 24 янв 2025, 01:58
Добавлено в форуме Python

Anonymous » 24 янв 2025, 01:58 » в форуме Python

Я пытаюсь вычислить некоторые производные результатов нейронной сети. Если быть точным, мне нужна матрица Якобиана функции, представленной нейронной сетью, и вторая производная функции по ее входным данным.
Я хочу умножить производную якобиана с...

0 Ответы

62 Просмотры

Последнее сообщение Anonymous
24 янв 2025, 01:58
Как умножить матрицу 2x3x3x3 на матрицу 2x3, чтобы получить матрицу 2x3

Последнее сообщение Anonymous « 24 янв 2025, 02:35
Добавлено в форуме Python

Anonymous » 24 янв 2025, 02:35 » в форуме Python

Я пытаюсь вычислить некоторые производные результатов нейронной сети. Если быть точным, мне нужна матрица Якобиана функции, представленной нейронной сетью, и вторая производная функции по ее входным данным.
Я хочу умножить производную якобиана с...

0 Ответы

55 Просмотры

Последнее сообщение Anonymous
24 янв 2025, 02:35
Маска R-CNN: Как определить форму выходных данных Lambda?

Последнее сообщение Anonymous « 01 окт 2024, 06:58
Добавлено в форуме Python

Anonymous » 01 окт 2024, 06:58 » в форуме Python

Я изучаю следующий пример кода Mask R-CNN:

Однако когда я запустил файл demo.ipynb, для приведенного ниже кода была возвращена ошибка, которую я не знаю, как исправить.
model = modellib.MaskRCNN(mode= inference , model_dir=MODEL_DIR,...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
01 окт 2024, 06:58
Постройте разреженную матрицу в Pyqtgraph

Последнее сообщение Anonymous « 16 сен 2024, 09:27
Добавлено в форуме Python

Anonymous » 16 сен 2024, 09:27 » в форуме Python

У меня большая разреженная матрица, и я хотел бы построить ее график с помощью pyqtgraph. На данный момент я просто конвертирую матрицу в полную матрицу с очевидным недостатком большого потребления памяти. Есть ли более элегантный способ построения...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 09:27

Вернуться в «Python»