Код: Выделить всё
from ABBYY import CloudOCR
ocr = CloudOCR(application_id='ApplicationID', password='SuperSecretPasswordFromAbbyy')
pdf = open('blah.pdf', 'rb')
file = {pdf.name: pdf}
result = ocr.process_and_download(
file,
exportFormat='xml,pdfTextAndImages',
language='English'
)
print(result)
< /code>
Вот ошибка, которую я получаю: < /p>
requests.exceptions.HTTPError: 403 Client Error: Forbidden for url: http://cloud.ocrsdk.com/processImage?exportFormat=xml%2CpdfTextAndImages&language=English
< /code>
Если я перейду по ссылке внутри ошибки Traceback, я вижу следующий текст: < /p>
404 HTTP method GET not supported for /processImage, only method POST supported
Метод #2
Я пытаюсь отправить локальный PDF на платформу Cloud OCR. У меня был успех, используя пакет, найденной здесь так: < /p>
$ export ABBYY_APPID='ApplicationID'
$ export ABBYY_PWD='SuperSecretPasswordFromAbbyy'
...
$ python process.py -pdf blah.pdf result.txt
< /code>
Я хочу реализовать систему, используя метод #1. Мне просто интересно, что делать по -другому, чтобы это произошло. Тот факт, что метод № 2 работает, показывает, что аутентификация не проблема.
Подробнее здесь: https://stackoverflow.com/questions/562 ... url-when-t