Я использую Tesseract для распознавания миллионов PDF-файлов и пытаюсь добиться максимальной производительности.
Мой текущий конвейер использует Convert для преобразования PDF-файлов в PNG-файлы (по одному на страницу), а затем использует Tesseract для каждого из них.
Во время профилирования я обнаружил, что много времени тратится на запись файлов на диск, а затем на их повторное чтение, поэтому я хотел бы перенести все это в памяти.
Преобразование PDF в PNG работает в памяти, поэтому теперь мне нужен способ передать BLOB-объект в памяти в Tesseract вместо того, чтобы передавать ему путь к файлу? Мне не удалось найти никакой документации или примеров?
Подробнее здесь: https://stackoverflow.com/questions/391 ... rom-memory
Как передать изображение в Тессеракт из памяти ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Мой бот не может выполнить капчу, используя селен и тессеракт [дубликат]
Anonymous » » в форуме JAVA - 0 Ответы
- 7 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Мой бот не может выполнить капчу, используя селен и тессеракт [дубликат]
Anonymous » » в форуме JAVA - 0 Ответы
- 7 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Мини-игра Python для автоматизации. Тессеракт не может найти один символ
Anonymous » » в форуме Python - 0 Ответы
- 10 Просмотры
-
Последнее сообщение Anonymous
-