Как пакетно обрабатывать длинные документы, превышающие лимит страниц в документах Google AI? - Цифровое Кемерово

Как пакетно обрабатывать длинные документы, превышающие лимит страниц в документах Google AI? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как пакетно обрабатывать длинные документы, превышающие лимит страниц в документах Google AI?

Цитата

Сообщение Anonymous » 25 июн 2024, 20:45

Я работаю с Google Document AI для обработки длинных документов, в которых количество страниц превышает предел процессора (~ 8 тыс. страниц). Текущий задокументированный лимит страниц для Enterprise OCR составляет 500 страниц для пакетной обработки, однако я могу успешно обработать около 2 тысяч страниц, прежде чем получить эту ошибку:

"status ": {
"code": 3,
"message": "Неверное содержимое входного документа."

Хотя я нашел в наборе инструментов Document AI метод создания пакетов для каталогов GCS, содержащих больше файлов, чем предел процессора, он не касается отдельных файлов со слишком большим количеством страниц.
Дополнительно , я обнаружил в ProcessOptions параметр для отправки диапазона страниц. Однако этот параметр предназначен только для онлайн-обработки, а не для пакетной обработки.
Я понимаю, что могу обойти ограничение на количество страниц, вручную разбив файлы, а затем объединив выходные данные, но я ищете решение, позволяющее избежать этой дополнительной предварительной и постобработки.
Существует ли простой способ пакетной обработки длинных документов, превышающих лимит страниц процессора, без их разделения и повторного объединения вручную? Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/786 ... page-limit

Реклама

1719337554

Anonymous

Я работаю с Google Document AI для обработки длинных документов, в которых количество страниц превышает предел процессора (~ 8 тыс. страниц). Текущий задокументированный лимит страниц для Enterprise OCR составляет 500 страниц для пакетной обработки, однако я могу успешно обработать около 2 тысяч страниц, прежде чем получить эту ошибку:

"status ": {
"code": 3,
"message": "Неверное содержимое входного документа."


Хотя я нашел в наборе инструментов Document AI метод создания пакетов для каталогов GCS, содержащих больше файлов, чем предел процессора, он не касается отдельных файлов со слишком большим количеством страниц.
Дополнительно , я обнаружил в ProcessOptions параметр для отправки диапазона страниц. Однако этот параметр предназначен только для онлайн-обработки, а не для пакетной обработки.
Я понимаю, что могу обойти ограничение на количество страниц, вручную разбив файлы, а затем объединив выходные данные, но я ищете решение, позволяющее избежать этой дополнительной предварительной и постобработки.
Существует ли простой способ пакетной обработки длинных документов, превышающих лимит страниц процессора, без их разделения и повторного объединения вручную? Спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/78637512/how-to-batch-process-long-documents-exceeding-the-google-document-ai-page-limit[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как пакетно обрабатывать длинные документы, превышающие лимит страниц в документах Google AI?

Последнее сообщение Anonymous « 23 ноя 2024, 09:50
Добавлено в форуме Python

Anonymous » 23 ноя 2024, 09:50 » в форуме Python

Я работаю с Google Document AI для обработки длинных документов, в которых количество страниц превышает предел процессора (~ 8 тыс. страниц). Текущий задокументированный лимит страниц для Enterprise OCR составляет 500 страниц для пакетной обработки,...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
23 ноя 2024, 09:50
Как пакетно обрабатывать сообщения в шине сообщений

Последнее сообщение Гость « 20 сен 2023, 17:28
Добавлено в форуме Php

Гость » 20 сен 2023, 17:28 » в форуме Php

В настоящее время я использую шину обмена сообщениями Symfony для асинхронной обработки задачи создания отчета. Сначала он запросит базу данных, а затем новое сообщение для каждого отчета, который необходимо создать. В настоящее время каждое...

0 Ответы

39 Просмотры

Последнее сообщение Гость
20 сен 2023, 17:28
Upwork GraphQL Поиск заданий API Правильный запрос и странификация страниц. Один на документах не работает

Последнее сообщение Anonymous « 24 апр 2025, 22:44
Добавлено в форуме Python

Anonymous » 24 апр 2025, 22:44 » в форуме Python

Ссылка документации: {
node {
title
description
createdDateTime
skills {
name
}
duration
job {
contractTerms {
contractType
hourlyContractTerms {
engagementType
}
}
}
client {
location {
country
}
totalfeedback
totalpostedJobs
totalhires...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
24 апр 2025, 22:44
Upwork GraphQL Поиск заданий API Правильный запрос и странификация страниц. Один на документах не работает

Последнее сообщение Anonymous « 25 апр 2025, 03:19
Добавлено в форуме Python

Anonymous » 25 апр 2025, 03:19 » в форуме Python

Upwork Graphql job search api correct query and pagination the one on docs is not working
Upwork Graphql api Documenation link :

below is my query according to the docs above, but Парень не работает, я получаю 8 результатов на страницу и 50 в...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
25 апр 2025, 03:19
Невозможно подсчитать нумерацию страниц в формате PDF. Использование счетчика (страниц) и счетчика (страниц) — это счетч

Последнее сообщение Anonymous « 19 окт 2023, 14:46
Добавлено в форуме CSS

Anonymous » 19 окт 2023, 14:46 » в форуме CSS

У меня есть отчет в формате html, и данные заполняются с использованием скорости Apache . Здесь я добавил нижний колонтитул. В разделе нижнего колонтитула будет показан номер страницы разбивки на страницы, но отображается Страница 0 из 0 > Я не...

0 Ответы

205 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 14:46

Вернуться в «Python»

Programmiererforum