Как увеличить разрешение текста в отсканированных изображениях в Python? - Цифровое Кемерово

Как увеличить разрешение текста в отсканированных изображениях в Python? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как увеличить разрешение текста в отсканированных изображениях в Python?

Цитата

Сообщение Anonymous » 26 ноя 2024, 19:54

Я использую tesseract-OCR для извлечения текста из отсканированных изображений. Для некоторых изображений текст не распознается должным образом из-за низкого разрешения, а на выходе присутствуют некоторые нерелевантные символы.

Примененные методы:

Увеличьте разрешение до 300.
Методы предварительной обработки изображений в opencv.
Масштабирование изображений с помощью dnn_superres в opencv
Методы удаления шума.< /p>
Рекомендуемые репозитории git, в которых модель алгоритма сверхвысокого разрешения разрабатывается с использованием глубокого обучения.
Улучшите качество tesseract-ocr путем обучения tessdata.

Справочные ссылки:

Повысьте точность распознавания отсканированных документов
обработка изображений для повышения точности распознавания текста tesseract

Пример изображения:

Есть В Python есть простой способ улучшить текст без использования какой-либо модели глубокого обучения.

Подробнее здесь: https://stackoverflow.com/questions/616 ... -in-python

1732640059

Anonymous

Я использую tesseract-OCR для извлечения текста из отсканированных изображений. Для некоторых изображений текст не распознается должным образом из-за низкого разрешения, а на выходе присутствуют некоторые нерелевантные символы.

[b]Примененные методы:[/b]

[list]
[*]Увеличьте разрешение до 300.[*]Методы предварительной обработки изображений в opencv.
[*]Масштабирование изображений с помощью dnn_superres в opencv
[*]Методы удаления шума.< /p>
[*]Рекомендуемые репозитории git, в которых модель алгоритма сверхвысокого разрешения разрабатывается с использованием глубокого обучения.
[*] Улучшите качество tesseract-ocr путем обучения tessdata.
[/list]

[b]Справочные ссылки[/b]:

[list]
[*]Повысьте точность распознавания отсканированных документов
[*]обработка изображений для повышения точности распознавания текста tesseract
[/list]

[b]Пример изображения:[/b]

[img]https://i.sstatic.net/etKLJ.png[/img]


Есть В Python есть простой способ улучшить текст без использования какой-либо модели глубокого обучения. 

Подробнее здесь: [url]https://stackoverflow.com/questions/61676455/how-to-increase-resolution-of-text-in-scanned-images-in-python[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»