Я работаю над проектом, где мне нужно обнаружить объекты в документе PDF.
После обнаружения объектов мне нужно прочитать текст в этом месте, поскольку он будет использоваться в качестве имени объекта. /> < /p>
Мне удалось обнаружить объекты, я использовал OpenCV для предварительного обработки изображения и хочу использовать Tesseract для чтения текста из изображения. Кроме того, я играл с разными режимами сегментации страниц, например, psm_single_word и psm_single_block. Первое изображение возвращает «t2, t3 \ n» с использованием psm_single_word (не используя psm_single_block, это возвращает «12,13 \ n»). Однако в большинстве случаев он не возвращает правильный текст. < /P>
предварительно обработанные изображения для справки:
Я работаю над проектом, где мне нужно обнаружить объекты в документе PDF. После обнаружения объектов мне нужно прочитать текст в этом месте, поскольку он будет использоваться в качестве имени объекта. /> < /p> Мне удалось обнаружить объекты, я использовал OpenCV для предварительного обработки изображения и хочу использовать Tesseract для чтения текста из изображения. Кроме того, я играл с разными режимами сегментации страниц, например, psm_single_word и psm_single_block. Первое изображение возвращает «t2, t3 \ n» с использованием psm_single_word (не используя psm_single_block, это возвращает «12,13 \ n»). Однако в большинстве случаев он не возвращает правильный текст. < /P> предварительно обработанные изображения для справки:
7th: Word: "T\n" Block: "111\n" Expected: “T11\n” < /code> Как вы можете видеть, иногда psm_single_word возвращает лучшие результаты, иногда делает psm_single_block, а иногда и ни один из них не возвращает правильный результат. Проблема.Pix* pixImage = pixCreate(eroded.cols, eroded.rows, 8); for (int y = 0; y < eroded.rows; y++) { for (int x = 0; x < eroded.cols; x++) { pixSetPixel(pixImage, x, y, eroded.at(y, x)); } }
QString dataDir = qApp->applicationDirPath() + QStringLiteral("/tessdata"); QString d = QDir::toNativeSeparators(dataDir);
Я пытаюсь запустить POC для извлечения текста из файла изображения с использованием tesseract-ocr в файле Code FastApi Python, установленном в DigitalOcean Farm Linux, и я Получите ошибку, в то время как запуск того же кода в моей местной среде Mac...
Я пытаюсь запустить POC для извлечения текста из файла изображения с использованием tesseract-ocr в файле Code FastApi Python, установленном в DigitalOcean Farm Linux, и я Получите ошибку, в то время как запуск того же кода в моей местной среде Mac...
Я пытаюсь рассчитать реальное время записи видео. У меня много видео, некоторые из которых были потеряны во время передачи. Все они в формате MP4. Чтобы получить продолжительность, я узнаю время с использованием pytesseract.image_to_string , но я...