У меня есть PDF-документ с разделом «Информация об обложке». В этом разделе есть строки, помеченные галочкой или изображением непроверенной отметки, связанное с ними. Как извлечь эту информацию с помощью AWS Textract OCR? В настоящее время я могу только читать текст.
Я прикрепил файл изображения для справки.
Я загрузил PDF-файл в AWS Textract, но он извлек только текст. Изображения с галочкой или негалочкой не были извлечены. Мне нужно определить, присутствует ли в строке изображение галочки, оно должно быть помечено как true. Если присутствует изображение с непроверенной отметкой, его следует пометить как ложное.
Подробнее здесь: https://stackoverflow.com/questions/793 ... imitations
Проблема AWS Textract OCR: устранение неполадок и устранение ошибок или ограничений OCR ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Устранение неполадок проходов LLVM: устранение ошибок прохода «aa» и «memdep» не найден
Anonymous » » в форуме C++ - 0 Ответы
- 69 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как извлечь и объединить текст и таблицы из PDF с помощью AWS Textract
Anonymous » » в форуме Python - 0 Ответы
- 33 Просмотры
-
Последнее сообщение Anonymous
-