Можно ли улучшить определение ориентации с помощью tesseract, указав язык и сценарий? - Цифровое Кемерово

Можно ли улучшить определение ориентации с помощью tesseract, указав язык и сценарий? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Можно ли улучшить определение ориентации с помощью tesseract, указав язык и сценарий?

Цитата

Сообщение Anonymous » 24 июн 2024, 15:35

Я использую tesseract для определения ориентации отсканированных изображений. В основном они содержат текст.
В целом это работает, но иногда не работает даже в простых случаях (например, текст четкий).

Когда это не удалось, я обнаружил, что в большинстве случаев «скрипт» обнаруживается ошибочно (например: как «Кириллица» или «Арабский»).
'page_num': 0,
'orientation': 0,
'rotate': 0,
'orientation_conf': 0.03,
'script': 'Cyrillic',
'script_conf': 1.48

Я заранее знаю текст: «Латинский», «Французский» или «Английский».
Есть ли способ указать это в tesseract? Я обнаружил, что это можно указать при преобразовании изображения в текст, но не при определении ориентации.
Вот код, который я использую:
img = cv2.imread(filename)
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #convert to black and white
img = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1] #high contrast
rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
results = pytesseract.image_to_osd(rgb, output_type=pytesseract.Output.DICT)
print(results["rotate"])

Подробнее здесь: https://stackoverflow.com/questions/786 ... ifying-lan

Реклама

1719232539

Anonymous

Я использую tesseract для определения ориентации отсканированных изображений. В основном они содержат текст.
В целом это работает, но иногда не работает даже в простых случаях (например, текст четкий).
[img]https://i.sstatic.net/KnVmFK3G.png[/img]

Когда это не удалось, я обнаружил, что в большинстве случаев «скрипт» обнаруживается ошибочно (например: как «Кириллица» или «Арабский»).
'page_num': 0,
'orientation': 0,
'rotate': 0,
'orientation_conf': 0.03,
'script': 'Cyrillic',
'script_conf': 1.48

Я заранее знаю текст: «Латинский», «Французский» или «Английский».
Есть ли способ указать это в tesseract? Я обнаружил, что это можно указать при преобразовании изображения в текст, но не при определении ориентации.
Вот код, который я использую:
img = cv2.imread(filename)
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #convert to black and white
img = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1] #high contrast
rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
results = pytesseract.image_to_osd(rgb, output_type=pytesseract.Output.DICT)
print(results["rotate"])
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78662482/is-it-possible-to-improve-orientation-detection-with-tesseract-by-specifying-lan[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

OpenCV производит ошибку "OcrtesserAct (33): tesseract не найдена" с рабочей установкой Tesseract

Последнее сообщение Anonymous « 22 июн 2025, 07:44
Добавлено в форуме Python

Anonymous » 22 июн 2025, 07:44 » в форуме Python

Этот сценарий Python 3.12.7 с Tesserocr 2.8.0 и OpenCV-Python 4.11.0.86 работает, как и ожидалось:
import cv2 as cv
from tesserocr import PyTessBaseAPI
from PIL import Image

img = cv.imread('text.jpg')
_, img = cv.threshold(img, 180, 255,...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
22 июн 2025, 07:44
OpenCV производит ошибку "OcrtesserAct (33): tesseract не найдена" с рабочей установкой Tesseract

Последнее сообщение Anonymous « 22 июн 2025, 15:18
Добавлено в форуме Python

Anonymous » 22 июн 2025, 15:18 » в форуме Python

Когда я пытаюсь использовать Tesseract из OpenCV-Python 4.11.0.86 с этим скриптом:
import cv2 as cv

img = cv.imread('text.jpg')
_, img = cv.threshold(img, 180, 255, cv.THRESH_BINARY_INV)
ocr =...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
22 июн 2025, 15:18
OpenCV производит ошибку "OcrtesserAct (33): tesseract не найдена" с рабочей установкой Tesseract

Последнее сообщение Anonymous « 22 июн 2025, 22:33
Добавлено в форуме Python

Anonymous » 22 июн 2025, 22:33 » в форуме Python

Когда я пытаюсь использовать Tesseract из OpenCV-Python 4.11.0.86 с этим скриптом:
import cv2 as cv

img = cv.imread('text.jpg')
_, img = cv.threshold(img, 180, 255, cv.THRESH_BINARY_INV)
ocr =...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
22 июн 2025, 22:33
Если щелкнуть фотографию в альбомной ориентации, а также нажать кнопку «ОК» в альбомной ориентации, изображение не отобр

Последнее сообщение Гость « 13 окт 2023, 16:54
Добавлено в форуме Android

Гость » 13 окт 2023, 16:54 » в форуме Android

Если щелкнуть фотографию в ландшафтном режиме, а также нажать кнопку «ОК» в ландшафтном режиме, изображение не отображается в режиме просмотра изображения на конкретном устройстве SAMSUNG с версией Android 12 или 13.

Необходимо отобразить снятое с...

0 Ответы

109 Просмотры

Последнее сообщение Гость
13 окт 2023, 16:54
Изменение ориентации в BlueStacks для проверки ориентации изменения моего приложения

Последнее сообщение Anonymous « 24 авг 2025, 23:00
Добавлено в форуме Android

Anonymous » 24 авг 2025, 23:00 » в форуме Android

Эмулятор Android 4.4, по -видимому, имеет ошибку, которая не дает ее соответствующему изменению вращения. Услышав, что BlueStacks в любом случае быстрее, я хотел дать ему шанс, но я не могу найти способ изменить свою ориентацию, пока в моем...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
24 авг 2025, 23:00

Вернуться в «Python»

Programmiererforum