Я управляю конфиденциальными PDF-документами, и мне нужно убедиться, что все метаданные удалены, прежде чем они будут переданы третьим лицам. В настоящее время мой процесс включает в себя физическую печать и сканирование документов для удаления любых метаданных, гарантируя сохранение только видимого содержимого. Я хочу автоматизировать этот процесс с помощью библиотеки iText в среде .NET (VB.NET или C#).
Я экспериментировал со следующими методами класса PdfDocumentInfo, чтобы очистить метаданные:
Код: Выделить всё
Dim info As PdfDocumentInfo = pdfDoc.GetDocumentInfo()
info.SetTitle(Nothing)
info.SetAuthor(Nothing)
info.SetSubject(Nothing)
info.SetKeywords(Nothing)
info.SetCreator(Nothing)
info.SetMoreInfo(Nothing)
info.RemoveCreationDate()
info.SetKeywords("")
info.SetTrapped(PdfName.AllOff)
Несмотря на эти усилия, я обнаружил, что:
- Метод SetCreator(Nothing) не полностью удаляет информацию об авторе.
- Метаданные XMP по-прежнему присутствуют в документе.
Мне нужен совет, как тщательно удалите все метаданные, включая XMP, из PDF-файлов с помощью iText в настройках .NET. Какие дополнительные шаги или методы следует рассмотреть, чтобы исключить сохранение метаданных?
Будем очень признательны за любые рекомендации и предложения!
Подробнее здесь:
https://stackoverflow.com/questions/791 ... ext-in-net