Получение ограничивающей рамки распознанных слов с помощью Python-tesseract

Получение ограничивающей рамки распознанных слов с помощью Python-tesseract ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Получение ограничивающей рамки распознанных слов с помощью Python-tesseract

Цитата

Сообщение Anonymous » 16 апр 2024, 10:37

Я использую python-tesseract для извлечения слов из изображения. Это оболочка Python для tesseract, который представляет собой код OCR.

Я использую следующий код для получения слов:

Код: Выделить всё

import tesseract

api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)

mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result

Это возвращает только слова, а не их расположение/размер/ориентацию (или, другими словами, ограничивающую рамку, содержащую их) на изображении. Мне было интересно, есть ли какой-нибудь способ получить это тоже

Подробнее здесь: https://stackoverflow.com/questions/208 ... -tesseract

1713253045

Anonymous

Я использую python-tesseract для извлечения слов из изображения. Это оболочка Python для tesseract, который представляет собой код OCR.

Я использую следующий код для получения слов:

[code]import tesseract

api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)

mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result
[/code]

Это возвращает только слова, а не их расположение/размер/ориентацию (или, другими словами, ограничивающую рамку, содержащую их) на изображении. Мне было интересно, есть ли какой-нибудь способ получить это тоже 

Подробнее здесь: [url]https://stackoverflow.com/questions/20831612/getting-the-bounding-box-of-the-recognized-words-using-python-tesseract[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Pytorch быстрее r-cnn, нет ошибки возвращаемого значения изображения ограничивающей рамки (все ограничивающие рамки долж

Последнее сообщение Anonymous « 30 июл 2024, 02:08
Добавлено в форуме Python

Anonymous » 30 июл 2024, 02:08 » в форуме Python

Я пытаюсь обучить Faster R-CNN на пользовательском наборе данных.
Когда я тренируюсь без изображения объекта (изображение без ограничивающих рамок), он возвращает ошибку значения: «Все ограничивающие рамки должны иметь положительную высоту и ширину»...

0 Ответы

63 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 02:08
Вычисление ограничивающей рамки широты/долготы с помощью формулы большого круга, радианы и градусы различаются

Последнее сообщение Anonymous « 21 окт 2023, 23:12
Добавлено в форуме Php

Anonymous » 21 окт 2023, 23:12 » в форуме Php

Я работаю над классом PHP для некоторых функций геолокации. Чтобы помочь с созданием SQL-запросов для поиска предприятий в базе данных, я написал функции get_bounding_box_rads и get_bounding_box_grades. Идея состоит в том, что вы указываете широту и...

0 Ответы

60 Просмотры

Последнее сообщение Anonymous
21 окт 2023, 23:12
Tensorflow: советы по дополнению данных с помощью ограничивающей рамки (для обнаружения объектов)

Последнее сообщение Anonymous « 01 июл 2024, 16:15
Добавлено в форуме Python

Anonymous » 01 июл 2024, 16:15 » в форуме Python

Мне нужен совет по эффективному увеличению данных для задачи обнаружения объектов (нейронная сеть YOLO) в tensorflow/keras.
Моим первым вариантом было использование слоев tf keras, но не все из них поддерживают ограничивающие рамки.Например:...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
01 июл 2024, 16:15
Извлечение контура лица из ограничивающей рамки лица с помощью платформы iOS Vision.

Последнее сообщение Anonymous « 14 окт 2024, 06:11
Добавлено в форуме IOS

Anonymous » 14 окт 2024, 06:11 » в форуме IOS

Я пытаюсь обрезать полный контур лица (т. е. только точки контура лица + точки бровей) из ориентиров лица, полученных из VNDetectFaceLandmarksRequest. У меня возникла проблема с переводом нормализованных точек контура лица, возвращаемых платформой...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
14 окт 2024, 06:11
ROI (область интереса) показывает две линии внутри одной ограничивающей рамки на изображении.

Последнее сообщение Гость « 14 мар 2024, 17:46
Добавлено в форуме Python

Гость » 14 мар 2024, 17:46 » в форуме Python

Я пытаюсь идеально распознать каждую строку с помощью полей ROI на изображении на хинди. Но проблема в том, что две строки с большим жирным текстом находятся внутри одной и той же рентабельности инвестиций. Вы можете увидеть на изображении ниже -...

0 Ответы

28 Просмотры

Последнее сообщение Гость
14 мар 2024, 17:46

Вернуться в «Python»