У меня есть небольшой проект на GitHub, в котором я пытаюсь создать PDF-файл, соответствующий разделу 508 (section508.gov), который имеет элементы формы внутри сложной структуры таблицы. Инструмент, рекомендуемый для проверки этих PDF-файлов, находится по адресу http://www.access-for-all.ch/en/pdf-lab ... r-pac.html, и выходной PDF-файл моей программы действительно проходит большинство этих проверок. Я также буду знать, для чего предназначено каждое поле во время выполнения, поэтому добавление тегов к элементам структуры не должно быть проблемой.
Проблема< /p>
Похоже, что в инструменте PAC 2 возникла проблема с двумя конкретными элементами выходного PDF-файла. В частности, аннотации виджетов моих переключателей не вложены внутри элемента структуры формы, а мой отмеченный контент не помечен тегами (текстовые и табличные ячейки).
PAC 2 проверяет элемент структуры P, который находится в верхней левой ячейке, но не маркированный контент…
Однако PAC 2 идентифицирует маркированный контент как ошибка (т. е. объект Text/Path не помечен).
Кроме того, виджеты-переключатели обнаруживаются, но, похоже, нет API-интерфейсов для добавления их в элемент структуры формы.
Что у меня есть Пробовал
Я просмотрел несколько вопросов на этом веб-сайте и другие по этой теме, включая этот PDF с тегами PDFBox, но кажется, что их почти нет. примеры для PDF/UA и очень мало полезной документации (которую я нашел). Самые полезные советы, которые я нашел, были на сайтах, объясняющих характеристики PDF-файлов с тегами, например https://taggedpdf.com/508-pdf-help-cent ... ot-tagged/.
Вопрос
Можно ли создать PDF-файл, проверяемый PAC 2, с помощью Apache PDFBox, который включает отмеченный контент и аннотации виджетов-переключателей? Если это возможно, возможно ли это использовать API PDFBox более высокого уровня (не устаревшие)?
Боковое примечание: на самом деле это мой первый вопрос о StackExchange (хотя я использовал сайт обширен) и надеюсь все в порядке! Не стесняйтесь вносить любые необходимые изменения и задавать любые вопросы, которые мне могут понадобиться уточнить. Кроме того, на GitHub у меня есть пример программы, которая генерирует мой PDF-документ по адресу https://github.com/chris271/UAPDFBox.
Редактирование 1: Прямая ссылка на выходной PDF-файл. Документ
*EDIT 2: после использования некоторых API-интерфейсов PDFBox нижнего уровня и просмотра потоков необработанных данных для получения полностью совместимых PDF-файлов с помощью PDFDebugger я смог создать PDF-файл с почти идентичной структурой содержимого по сравнению со структурой содержимого совместимого PDF-файла... Однако появляются те же ошибки, что текстовые объекты не помечены тегами, и я действительно не могу решить, куда идти дальше... Любое руководство будет очень признателен!
Редактирование 3: Параллельное сравнение необработанного содержимого PDF-файла.
Редактирование 4: Внутренняя структура созданного PDF

и совместимый PDF

Изменить 5: Мне удалось исправить ошибки PAC 2 для тегированных объектов пути/текста, отчасти благодаря предложениям Тилмана Хаушерра! Я добавлю ответ, если мне удастся исправить проблемы, связанные с тем, что «виджеты аннотаций не вложены в элементы структуры формы».
Подробнее здесь: https://stackoverflow.com/questions/496 ... -is-also-v
Мобильная версия