Метод № 1
Я уходя с этой страницы (вот Github). Я использую этот код:
Код: Выделить всё
from ABBYY import CloudOCR
ocr = CloudOCR(application_id='ApplicationID', password='SuperSecretPasswordFromAbbyy')
pdf = open('blah.pdf', 'rb')
file = {pdf.name: pdf}
result = ocr.process_and_download(
file,
exportFormat='xml,pdfTextAndImages',
language='English'
)
print(result)
Код: Выделить всё
requests.exceptions.HTTPError: 403 Client Error: Forbidden for url: http://cloud.ocrsdk.com/processImage?exportFormat=xml%2CpdfTextAndImages&language=English
Код: Выделить всё
404 HTTP method GET not supported for /processImage, only method POST supported
Я пытаюсь отправить локальный PDF-файл на платформу Cloud OCR. Мне удалось использовать пакет, найденный здесь, вот так:
Код: Выделить всё
$ export ABBYY_APPID='ApplicationID'
$ export ABBYY_PWD='SuperSecretPasswordFromAbbyy'
...
$ python process.py -pdf blah.pdf result.txt
Подробнее здесь: https://stackoverflow.com/questions/562 ... url-when-t