Есть ли способ сделать pytesserAct.image_to_pdf_or_hocr вывод как PDF, так и текстовые данные? Lang-Py PrettyPrint-Override ">pdf = pytesseract.image_to_pdf_or_hocr(fp.name, extension='pdf')
text = pytesseract.image_to_string(fp.name)
< /code>
Есть ли способ сделать что -то подобное, чтобы Tesseract работает только один раз? Если нет, какой способ сделать это лучше?pdf, text = pytesseract.image_to_pdf_or_hocr(fp.name, extension='pdf')
Подробнее здесь: https://stackoverflow.com/questions/625 ... -also-text