«Паддлокра возвращает странные результаты при извлечении текста из обнаруженных областей на изображениях»

«Паддлокра возвращает странные результаты при извлечении текста из обнаруженных областей на изображениях» ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

«Паддлокра возвращает странные результаты при извлечении текста из обнаруженных областей на изображениях»

Цитата

Сообщение Anonymous » 07 фев 2025, 22:08

Я использую Paddleocr для извлечения текста из определенных областей изображения, и я сталкиваюсь с проблемой, когда иногда результаты OCR возвращают только координаты (например, ниже) вместо фактического текста, даже если область содержит видимый текст . < /p>
Пример вывода ocr.ocr () в некоторых регионах: < /p>
[66.0, 38.0] [94.0, 38.0] [94.0, 113.0] [66.0, 113.0]
[32.0, 44.0] [111.0, 48.0] [110.0, 76.0] [31.0, 72.0]
[53.0, 106.0] [70.0, 106.0] [70.0, 128.0] [53.0, 128.0]
[46.0, 27.0] [78.0, 27.0] [78.0, 52.0] [46.0, 52.0]
[35.0, 59.0] [121.0, 57.0] [122.0, 86.0] [36.0, 88.0]
[34.0, 53.0] [51.0, 53.0] [51.0, 78.0] [34.0, 78.0]
[61.0, 20.0] [90.0, 19.0] [92.0, 159.0] [63.0, 160.0]
[17.0, 43.0] [45.0, 43.0] [45.0, 117.0] [17.0, 117.0]
[47.0, 39.0] [79.0, 39.0] [79.0, 65.0] [47.0, 65.0]
< /code>
Я передаю координаты областей падлоке и пытаюсь извлечь из них текст. Однако иногда я получаю только координаты и отсутствие текста, даже если внутри регионов есть видимый текст. /p>
from paddleocr import PaddleOCR
def recognize_text_from_bubbles(image, lang, detections):
lang_mapping = {
"Japanese": "jp",
"English": "en",
"Chinese": "ch"
}
ocr_lang = lang_mapping.get(lang, "en")
ocr = PaddleOCR(lang=ocr_lang, use_angle_cls=True)
recognized_text = ""
for detection in detections:
x, y, w, h = detection
x = int(x) - int(w / 2)
y = int(y) - int(h / 2)
roi = image[y:y + int(h), x:x + int(w)]
result = ocr.ocr(roi, cls=True)
if result:
for line in result:
if len(line) > 1 and line[1]:
candidate = line[1][0]
recognized_text += candidate + "\n"
else:
print(f"Empty or invalid OCR result for line: {line}")
else:
print("No text detected in this region.")
if not recognized_text:
print("No text was recognized.")
return recognized_text
< /code>
Что я попробовал < /p>

Убедиться, что ограничивающие ящики обнаружения правильно рассчитаны. < /li>
Пробовал разные изображения с различными стилями текста и размерами. Проверяет ни на нет значений и пустых списков, но OCR по -прежнему иногда не может возвращать какой -либо текст. Извлечение текста из этих регионов и как я могу повысить точность распознавания текста из этих регионов? Есть ли какая -либо предварительная обработка или корректировки, которые я мог бы применить, чтобы помочь OCR лучше работать в извлеченных областях?

Подробнее здесь: https://stackoverflow.com/questions/794 ... ed-regions

1738955284

Anonymous

 Я использую Paddleocr для извлечения текста из определенных областей изображения, и я сталкиваюсь с проблемой, когда иногда результаты OCR возвращают только координаты (например, ниже) вместо фактического текста, даже если область содержит видимый текст . < /p>
Пример вывода ocr.ocr () в некоторых регионах: < /p>
[66.0, 38.0] [94.0, 38.0] [94.0, 113.0] [66.0, 113.0]
[32.0, 44.0] [111.0, 48.0] [110.0, 76.0] [31.0, 72.0]
[53.0, 106.0] [70.0, 106.0] [70.0, 128.0] [53.0, 128.0]
[46.0, 27.0] [78.0, 27.0] [78.0, 52.0] [46.0, 52.0]
[35.0, 59.0] [121.0, 57.0] [122.0, 86.0] [36.0, 88.0]
[34.0, 53.0] [51.0, 53.0] [51.0, 78.0] [34.0, 78.0]
[61.0, 20.0] [90.0, 19.0] [92.0, 159.0] [63.0, 160.0]
[17.0, 43.0] [45.0, 43.0] [45.0, 117.0] [17.0, 117.0]
[47.0, 39.0] [79.0, 39.0] [79.0, 65.0] [47.0, 65.0]
< /code>
Я передаю координаты областей падлоке и пытаюсь извлечь из них текст. Однако иногда я получаю только координаты и отсутствие текста, даже если внутри регионов есть видимый текст. /p>
from paddleocr import PaddleOCR
def recognize_text_from_bubbles(image, lang, detections):
lang_mapping = {
"Japanese": "jp",
"English": "en",
"Chinese": "ch"
}
ocr_lang = lang_mapping.get(lang, "en")
ocr = PaddleOCR(lang=ocr_lang, use_angle_cls=True)
recognized_text = ""
for detection in detections:
x, y, w, h = detection
x = int(x) - int(w / 2)
y = int(y) - int(h / 2)
roi = image[y:y + int(h), x:x + int(w)]
result = ocr.ocr(roi, cls=True)
if result:
for line in result:
if len(line) > 1 and line[1]:
candidate = line[1][0]
recognized_text += candidate + "\n"
else:
print(f"Empty or invalid OCR result for line: {line}")
else:
print("No text detected in this region.")
if not recognized_text:
print("No text was recognized.")
return recognized_text
< /code>
Что я попробовал < /p>

 Убедиться, что ограничивающие ящики обнаружения правильно рассчитаны. < /li>
 Пробовал разные изображения с различными стилями текста и размерами. Проверяет ни на нет значений и пустых списков, но OCR по -прежнему иногда не может возвращать какой -либо текст. Извлечение текста из этих регионов и как я могу повысить точность распознавания текста из этих регионов? Есть ли какая -либо предварительная обработка или корректировки, которые я мог бы применить, чтобы помочь OCR лучше работать в извлеченных областях?  

Подробнее здесь: [url]https://stackoverflow.com/questions/79421711/paddleocr-returning-strange-results-when-extracting-text-from-detected-regions[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

«Паддлокра возвращает странные результаты при извлечении текста из обнаруженных областей на изображениях»

Последнее сообщение Anonymous « 07 фев 2025, 20:34
Добавлено в форуме Python

Anonymous » 07 фев 2025, 20:34 » в форуме Python

Я использую Paddleocr для извлечения текста из определенных областей изображения, и я сталкиваюсь с проблемой, когда иногда результаты OCR возвращают только координаты (например, ниже) вместо фактического текста, даже если область содержит видимый...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
07 фев 2025, 20:34
Странные результаты с HuggingFace Transformer[marianmt] переводом большего текста

Последнее сообщение Anonymous « 03 окт 2024, 18:36
Добавлено в форуме Python

Anonymous » 03 окт 2024, 18:36 » в форуме Python

Мне нужно перевести большие объемы текста из базы данных. Поэтому несколько дней занимаюсь трансформерами и моделями. Я совершенно не эксперт в области науки о данных и, к сожалению, не могу продвигаться дальше.
Проблема начинается с более длинного...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 18:36
Python mercantile возвращает странные результаты

Последнее сообщение Anonymous « 24 дек 2024, 18:35
Добавлено в форуме Python

Anonymous » 24 дек 2024, 18:35 » в форуме Python

Я пытаюсь использовать mercantile для отображения плитки из Maptiler. Однако не похоже, что плитки выстроены правильно.
Я пытаюсь вытащить плитку для -95,1017, 40,9778, используя это:
tile = mercantile.tile(-95.1017, 40.9778, 12)
и я получаю:...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
24 дек 2024, 18:35
Python думает, что у Эйлера проблемы с идентификацией (cmath возвращает странные результаты)

Последнее сообщение Anonymous « 06 янв 2025, 03:17
Добавлено в форуме Python

Anonymous » 06 янв 2025, 03:17 » в форуме Python

Мой код:

import math
import cmath
print E^ln(-1) , cmath.exp(cmath.log(-1))

Что он печатает:

E^ln(-1) (-1+1.2246467991473532E-16j)

Что должно быть напечатано:

-1

(Для справки: Google проверяет мои расчеты)

Согласно документации на...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
06 янв 2025, 03:17
Странные результаты при вычитании маски из контура в OpenCV

Последнее сообщение Anonymous « 01 ноя 2023, 12:36
Добавлено в форуме Python

Anonymous » 01 ноя 2023, 12:36 » в форуме Python

Я хотел бы вычесть маску (синюю) из контура (красного):

Я использую следующий упрощенный код, но методы те же:

# Получаем первое изображение и его маску img1_gray = cv.cvtColor(cv.imread( image1.png ), cv.COLOR_BGR2GRAY) порог, theMask =...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
01 ноя 2023, 12:36

Вернуться в «Python»