Как создать доступный PDF-файл с помощью библиотеки Java PDFBox 2.0.8, который также можно проверить с помощью инструменJAVA

Программисты JAVA общаются здесь
Ответить
Anonymous
 Как создать доступный PDF-файл с помощью библиотеки Java PDFBox 2.0.8, который также можно проверить с помощью инструмен

Сообщение Anonymous »

Справочная информация

У меня есть небольшой проект на GitHub, в котором я пытаюсь создать PDF-файл, соответствующий разделу 508 (section508.gov), который имеет элементы формы внутри сложной структуры таблицы. Инструмент, рекомендуемый для проверки этих PDF-файлов, находится по адресу http://www.access-for-all.ch/en/pdf-lab ... r-pac.html, и выходной PDF-файл моей программы действительно проходит большинство этих проверок. Я также буду знать, для чего предназначено каждое поле во время выполнения, поэтому добавление тегов к элементам структуры не должно быть проблемой.

Проблема< /p>

Похоже, что в инструменте PAC 2 возникла проблема с двумя конкретными элементами выходного PDF-файла. В частности, аннотации виджетов моих переключателей не вложены внутри элемента структуры формы, а мой отмеченный контент не помечен тегами (текстовые и табличные ячейки).
PAC 2 проверяет элемент структуры P, который находится в верхней левой ячейке, но не маркированный контент…

Однако PAC 2 идентифицирует маркированный контент как ошибка (т. е. объект Text/Path не помечен).
Кроме того, виджеты-переключатели обнаруживаются, но, похоже, нет API-интерфейсов для добавления их в элемент структуры формы.

Что у меня есть Пробовал

Я просмотрел несколько вопросов на этом веб-сайте и другие по этой теме, включая этот PDF с тегами PDFBox, но кажется, что их почти нет. примеры для PDF/UA и очень мало полезной документации (которую я нашел). Самые полезные советы, которые я нашел, были на сайтах, объясняющих характеристики PDF-файлов с тегами, например https://taggedpdf.com/508-pdf-help-cent ... ot-tagged/.

Вопрос

Можно ли создать PDF-файл, проверяемый PAC 2, с помощью Apache PDFBox, который включает отмеченный контент и аннотации виджетов-переключателей? Если это возможно, возможно ли это использовать API PDFBox более высокого уровня (не устаревшие)?

Боковое примечание: на самом деле это мой первый вопрос о StackExchange (хотя я использовал сайт обширен) и надеюсь все в порядке! Не стесняйтесь вносить любые необходимые изменения и задавать любые вопросы, которые мне могут понадобиться уточнить. Кроме того, на GitHub у меня есть пример программы, которая генерирует мой PDF-документ по адресу https://github.com/chris271/UAPDFBox.

Редактирование 1: Прямая ссылка на выходной PDF-файл. Документ

*EDIT 2: после использования некоторых API-интерфейсов PDFBox нижнего уровня и просмотра потоков необработанных данных для получения полностью совместимых PDF-файлов с помощью PDFDebugger я смог создать PDF-файл с почти идентичной структурой содержимого по сравнению со структурой содержимого совместимого PDF-файла... Однако появляются те же ошибки, что текстовые объекты не помечены тегами, и я действительно не могу решить, куда идти дальше... Любое руководство будет очень признателен!

Редактирование 3: Параллельное сравнение необработанного содержимого PDF-файла.

Редактирование 4: Внутренняя структура созданного PDF

Изображение


и совместимый PDF

Изображение


Изменить 5: Мне удалось исправить ошибки PAC 2 для тегированных объектов пути/текста, отчасти благодаря предложениям Тилмана Хаушерра! Я добавлю ответ, если мне удастся исправить проблемы, связанные с тем, что «виджеты аннотаций не вложены в элементы структуры формы».

Подробнее здесь: https://stackoverflow.com/questions/496 ... -is-also-v
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «JAVA»