Я уже выполнил следующие шаги:
- Вызвал API процесса v1 с моим PDF-файлом и извлек данные страницы в файл page.json.
- Вызвал API для создания процессора типа настраиваемое извлечение.
- Вызвал API для установки набора данных.
- Вызвал API для обновления схемы набора данных.
Когда я проверяю операцию с помощью LRO API, статус ответа:
"status": {
"code": 13,
"message": "Internal error encountered."
}
Я не уверен, что не так с моим файлом JSON.
Я использую JSON, сгенерированный в результате процесса оптического распознавания символов, и добавил поле объектов, которое содержит ограничивающие рамки, нарисованные во внешнем интерфейсе.
Вот пример моего файла JSON:
{
"uri": "gs://.../templates/1/21/1_21_template.pdf",
"mimeType": "application/pdf",
"text": "長江紙器(株)(丸長紙器分)\n .... ",
"pages": [],
"shardInfo": {
"shardCount": "1"
},
"entities": [
{
"id": "f2fa641c27a18cda",
"confidence": 1,
"type": "company_name",
"mentionText": "長江紙器(株)(丸長紙器分)",
"pageAnchor": {
"pageRefs": [
{
"page": 0,
"boundingPoly": {
"normalizedVertices": [
{ "x": 0.0600458875464684, "y": 0.0622944078947368 },
{ "x": 0.284023582713755, "y": 0.0622944078947368 },
{ "x": 0.284023582713755, "y": 0.0991365131578947 },
{ "x": 0.0600458875464684, "y": 0.0991365131578947 }
]
},
"layoutType": "VISUAL_ELEMENT"
}
]
}
},
{
"id": "8e7072d559904372",
"confidence": 1,
"type": "ord_id",
"mentionText": "2334082",
"pageAnchor": {
"pageRefs": [
{
"page": 0,
"boundingPoly": {
"normalizedVertices": [
{ "x": 0.0628339916356877, "y": 0.372820723684211 },
{ "x": 0.110231761152416, "y": 0.372820723684211 },
{ "x": 0.110231761152416, "y": 0.397820723684211 },
{ "x": 0.0628339916356877, "y": 0.397820723684211 }
]
},
"layoutType": "VISUAL_ELEMENT"
}
]
}
}
]
}
Подробнее здесь: https://stackoverflow.com/questions/798 ... g-rest-api
Мобильная версия