ROI (область интереса) показывает две линии внутри одной ограничивающей рамки на изображении.

ROI (область интереса) показывает две линии внутри одной ограничивающей рамки на изображении. ⇐ Python

1 сообщение • Страница 1 из 1

Гость

ROI (область интереса) показывает две линии внутри одной ограничивающей рамки на изображении.

Цитата

Сообщение Гость » 14 мар 2024, 17:46

Я пытаюсь идеально распознать каждую строку с помощью полей ROI на изображении на хинди. Но проблема в том, что две строки с большим жирным текстом находятся внутри одной и той же рентабельности инвестиций. Вы можете увидеть на изображении ниже -

Исходное изображение —

Каждая строка должна точно распознаваться как отдельная строка. Вот исходный код -
import cv2
from google.colab.patches import cv2_imshow
import numpy as np

if __name__ == "__main__":
image = cv2.imread('datasets/0010_jpg.rf.e7741188a2afa6db3dee4324e8486a34.jpg')

# Display the image
# cv2_imshow(image)

# Convert image to grayscale
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# cv2_imshow(gray)

# Convert grayscale image to binary
ret, thresh = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY_INV)
# cv2_imshow(thresh)

# Apply Canny edge detection
edges = cv2.Canny(thresh, 50, 150) # Adjust the threshold values as needed
# cv2_imshow(edges)

# Dilation
kernel = np.ones((5, 200), np.uint8)
img_dilation = cv2.dilate(edges, kernel, iterations=1)
# cv2_imshow(img_dilation)

# Find contours
contours, hierarchy = cv2.findContours(img_dilation.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# Sort contours based on their bounding box coordinates
bounding_boxes = [cv2.boundingRect(ctr) for ctr in contours]
sorted_contours = [ctr for _, ctr in sorted(zip(bounding_boxes, contours), key=lambda pair: pair[0][1])]

# Loop over sorted contours
for i, ctr in enumerate(sorted_contours):
# Get bounding box
x, y, w, h = cv2.boundingRect(ctr)

# Getting ROI
roi = image[y:y+h-5, x:x+w]
roi_row = roi.shape[0]
roi_col = roi.shape[1]

# Show ROI
if(roi_row>3000 or roi_row

Подробнее здесь: https://stackoverflow.com/questions/781 ... x-in-image

1710427615

Гость

Я пытаюсь идеально распознать каждую строку с помощью полей ROI на изображении на хинди. Но проблема в том, что две строки с большим жирным текстом находятся внутри одной и той же рентабельности инвестиций. Вы можете увидеть на изображении ниже -
[img]https://i.stack.imgur.com/HqM55.png[/img]
 
Исходное изображение — 
[img]https://i.stack.imgur.com/VoeQT.jpg[/img]
Каждая строка должна точно распознаваться как отдельная строка. Вот исходный код -
import cv2
from google.colab.patches import cv2_imshow
import numpy as np

if __name__ == "__main__":
image = cv2.imread('datasets/0010_jpg.rf.e7741188a2afa6db3dee4324e8486a34.jpg')

# Display the image
# cv2_imshow(image)

# Convert image to grayscale
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# cv2_imshow(gray)

# Convert grayscale image to binary
ret, thresh = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY_INV)
# cv2_imshow(thresh)

# Apply Canny edge detection
edges = cv2.Canny(thresh, 50, 150)  # Adjust the threshold values as needed
# cv2_imshow(edges)

# Dilation
kernel = np.ones((5, 200), np.uint8)
img_dilation = cv2.dilate(edges, kernel, iterations=1)
# cv2_imshow(img_dilation)

# Find contours
contours, hierarchy = cv2.findContours(img_dilation.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# Sort contours based on their bounding box coordinates
bounding_boxes = [cv2.boundingRect(ctr) for ctr in contours]
sorted_contours = [ctr for _, ctr in sorted(zip(bounding_boxes, contours), key=lambda pair: pair[0][1])]

# Loop over sorted contours
for i, ctr in enumerate(sorted_contours):
# Get bounding box
x, y, w, h = cv2.boundingRect(ctr)

# Getting ROI
roi = image[y:y+h-5, x:x+w]
roi_row = roi.shape[0]
roi_col = roi.shape[1]

# Show ROI
if(roi_row>3000 or roi_row

Подробнее здесь: [url]https://stackoverflow.com/questions/78161378/roi-region-of-interest-is-showing-two-lines-inside-same-bounding-box-in-image[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как использовать область интереса (ROI) для распознавания текста ML Kit с предварительным просмотром камеры в Android?

Последнее сообщение Anonymous « 03 окт 2024, 13:09
Добавлено в форуме Android

Anonymous » 03 окт 2024, 13:09 » в форуме Android

Я работаю над приложением для Android, используя Jetpack Compose и API распознавания текста ML Kit. Я хочу реализовать область интереса (ROI), чтобы распознавание текста обрабатывало изображения только в этой конкретной области предварительного...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 13:09
PyQtGraph ROI RemoveHandle не удаляет круговой дескриптор для эллиптической ROI

Последнее сообщение Anonymous « 04 авг 2024, 06:54
Добавлено в форуме Python

Anonymous » 04 авг 2024, 06:54 » в форуме Python

Моя цель – запрограммировать рентабельность инвестиций в виде эллипса, который нельзя вращать. Рассмотрим следующий фрагмент кода, модифицированный на основе одного из примеров PyQtGraph:

import numpy as np
import cv2
import pyqtgraph as pg
from...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
04 авг 2024, 06:54
Pytorch быстрее r-cnn, нет ошибки возвращаемого значения изображения ограничивающей рамки (все ограничивающие рамки долж

Последнее сообщение Anonymous « 30 июл 2024, 02:08
Добавлено в форуме Python

Anonymous » 30 июл 2024, 02:08 » в форуме Python

Я пытаюсь обучить Faster R-CNN на пользовательском наборе данных.
Когда я тренируюсь без изображения объекта (изображение без ограничивающих рамок), он возвращает ошибку значения: «Все ограничивающие рамки должны иметь положительную высоту и ширину»...

0 Ответы

62 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 02:08
Автоматически выбирать область интереса в Python

Последнее сообщение Anonymous « 28 июн 2024, 00:58
Добавлено в форуме Python

Anonymous » 28 июн 2024, 00:58 » в форуме Python

Я работаю над оптическим проектом, и мне нужно извлечь интересующую область (ROI) из набора фотографий, состоящего из 32 фотографий вращающегося квадрата. Я нашел способ найти интересующую область, рассчитав дисперсию всего набора фотографий, как...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
28 июн 2024, 00:58
Автоматически выбирать область интереса в Python

Последнее сообщение Anonymous « 28 июн 2024, 02:07
Добавлено в форуме Python

Anonymous » 28 июн 2024, 02:07 » в форуме Python

Я работаю над оптическим проектом, и мне нужно извлечь интересующую область (ROI) из набора фотографий, состоящего из 32 фотографий вращающегося квадрата. Я нашел способ найти интересующую область, рассчитав дисперсию всего набора фотографий, как...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
28 июн 2024, 02:07

Вернуться в «Python»