Усовершенствование изображений плана этажа в PDF

Усовершенствование изображений плана этажа в PDF ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Усовершенствование изображений плана этажа в PDF

Цитата

Сообщение Anonymous » 31 янв 2025, 19:46

Мы работаем над проектом, чтобы включить OCR на PDF. Мы использовали ocrmypdf (который использует Tesseract) в фоновом режиме, и он работает прилично хорошо для ~ 95% страниц. Резолюция не является наибольшим, и, следовательно, оно не может правильно захватить имя или номер. Образец изображения был прикреплен. Запуск примера кода: < /p>

Код: Выделить всё

% ocrmypdf --force-ocr --deskew --rotate-pages --rotate-pages-threshold 1.0 --oversample 600

Мы также попытались улучшить конкретные страницы с помощью ImageMagick до работы OCRMYPDF, и, хотя это помогает биться в сочинениях, это сильно размывает их. Образец запуска: < /p>

Код: Выделить всё

magick  -brightness-contrast -20x40 -depth 8 -colors 8

Есть ли другие способы, которыми мы можем рассмотреть вопрос о подходе этой проблемы? Должны ли мы рассмотреть другой усилитель изображения, а затем запуск OCR?

Подробнее здесь: https://stackoverflow.com/questions/794 ... es-in-pdfs

1738341960

Anonymous

 Мы работаем над проектом, чтобы включить OCR на PDF. Мы использовали ocrmypdf (который использует Tesseract) в фоновом режиме, и он работает прилично хорошо для ~ 95% страниц. Резолюция не является наибольшим, и, следовательно, оно не может правильно захватить имя или номер. Образец изображения был прикреплен. Запуск примера кода: < /p>
[code]% ocrmypdf --force-ocr --deskew --rotate-pages --rotate-pages-threshold 1.0 --oversample 600   [/code] 
Мы также попытались улучшить конкретные страницы с помощью ImageMagick до работы OCRMYPDF, и, хотя это помогает биться в сочинениях, это сильно размывает их. Образец запуска: < /p>
[code]magick  -brightness-contrast -20x40 -depth 8 -colors 8 [/code] 
Есть ли другие способы, которыми мы можем рассмотреть вопрос о подходе этой проблемы? Должны ли мы рассмотреть другой усилитель изображения, а затем запуск OCR?   

Подробнее здесь: [url]https://stackoverflow.com/questions/79403423/enhancing-floor-plan-images-in-pdfs[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Усовершенствование изображений плана этажа в PDF

Последнее сообщение Anonymous « 31 янв 2025, 22:05
Добавлено в форуме Python

Anonymous » 31 янв 2025, 22:05 » в форуме Python

Мы работаем над проектом, чтобы включить OCR на PDF. Мы использовали ocrmypdf (который использует Tesseract) в фоновом режиме, и он работает прилично хорошо для ~ 95% страниц. Резолюция не является наибольшим, и, следовательно, оно не может...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
31 янв 2025, 22:05
Попытка получить координаты из плана 2D-карты этажа с использованием OpenCV с использованием Python, но отсутствуют неко

Последнее сообщение Anonymous « 04 июл 2024, 15:48
Добавлено в форуме Python

Anonymous » 04 июл 2024, 15:48 » в форуме Python

Итак, я пытаюсь получить координаты данного трехмерного плана этажа, и эти координаты будут использоваться в программе Javascript с использованием THREE.JS, THREE.Vector3 и THREE.ExtrumeGeometry.
Это код, который я использовал:
import cv2 as cv

#...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
04 июл 2024, 15:48
Попытка получить координаты из плана 2D-карты этажа с использованием OpenCV с использованием Python, но отсутствуют неко

Последнее сообщение Anonymous « 04 июл 2024, 23:51
Добавлено в форуме Python

Anonymous » 04 июл 2024, 23:51 » в форуме Python

Итак, я пытаюсь получить координаты данного трехмерного плана этажа, и эти координаты будут использоваться в программе Javascript с использованием THREE.JS, THREE.Vector3 и THREE.ExtrumeGeometry.
Это код, который я использовал:
import cv2 as cv

#...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
04 июл 2024, 23:51
Как определить ориентацию на плане этажа с помощью PaddleOCR или других инструментов анализа изображений?

Последнее сообщение Anonymous « 10 янв 2025, 04:12
Добавлено в форуме Python

Anonymous » 10 янв 2025, 04:12 » в форуме Python

Я работаю над задачей, которая включает в себя анализ планов этажей с использованием мультимодальных моделей искусственного интеллекта (например, Google Gemini) для извлечения структурированной информации, такой как расположение точек входа, спален...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
10 янв 2025, 04:12
Исключение Android 14 при запуске службы переднего плана с типами переднего плана

Последнее сообщение Anonymous « 01 ноя 2024, 07:31
Добавлено в форуме Android

Anonymous » 01 ноя 2024, 07:31 » в форуме Android

Я пытаюсь изменить поведение своего приложения для вызовов в соответствии с изменениями в поведении OS14.

Приложение работает нормально, когда оно находится в состоянии переднего плана. Это блок кода, используемый для запуска службы переднего...

0 Ответы

60 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 07:31

Вернуться в «Python»