Я потерялся в трансформации. Попытка визуализировать ограничивающую рамку текста с помощью патча. Ни необработанный bb_du, полученный с помощью .get_window_extent(), ни преобразованный bb_dc не возвращают размер ограничительной рамки, подходящий для создания прямоугольника.
Вот моя попытка:
Я потерялся в трансформации. Попытка визуализировать ограничивающую рамку текста с помощью патча. Ни необработанный bb_du, полученный с помощью .get_window_extent(), ни преобразованный bb_dc не возвращают размер ограничительной рамки, подходящий для создания прямоугольника. Вот моя попытка: [img]https://i.sstatic.net/Kn67HYYG.png[/img]
[code]import matplotlib.pyplot as plt from matplotlib.patches import Rectangle
# Plot rectangle to visualize the text bounding box def plot_bbox(handle): # Get the bounding box in display units bb_du = handle.get_window_extent()
# Convert to data coordinates to display coordinates t = ax.transData.inverted() bb_dc = bb_du.transformed(t) x0, y0 = bb_dc.min x1, y1 = bb_dc.max w = x1 - x0 h = y1 - y0 print(f'{x0:.2f}, {y0:.2f}, {w:.2f}, {h:.2f}')
# Draw a rectangle for the bounding box rect = Rectangle((x0, y0), w, h, fc='none', color ='m', linewidth = 2) ax.add_patch(rect)
Я пытаюсь обучить Faster R-CNN на пользовательском наборе данных.
Когда я тренируюсь без изображения объекта (изображение без ограничивающих рамок), он возвращает ошибку значения: «Все ограничивающие рамки должны иметь положительную высоту и ширину»...
Я работаю над классом PHP для некоторых функций геолокации. Чтобы помочь с созданием SQL-запросов для поиска предприятий в базе данных, я написал функции get_bounding_box_rads и get_bounding_box_grades. Идея состоит в том, что вы указываете широту и...
Я пытаюсь идеально распознать каждую строку с помощью полей ROI на изображении на хинди. Но проблема в том, что две строки с большим жирным текстом находятся внутри одной и той же рентабельности инвестиций. Вы можете увидеть на изображении ниже -...
Я использовал службу Azure OCR для извлечения текста из PDF-файлов. Для каждой страницы PDF-файла выходные данные OCR содержат список текстовых строк, а также значения ограничивающей рамки для этой строки. Мой первоначальный подход к...