Тика возвращает искаженный текст из PDF-файла

Тика возвращает искаженный текст из PDF-файла ⇐ JAVA

1 сообщение • Страница 1 из 1

Гость

Тика возвращает искаженный текст из PDF-файла

Сообщение Гость » 14 мар 2024, 11:28

Я преобразую PDF-файлы в TXT. Большинство PDF-файлов работают нормально, но один из них возвращает только искаженный текст, например:

Код: Выделить всё

� . LEZI E TVSZIR XVEGO VIGSVH SJ PIEHMRK ERH QIR�
XSVMRK XIEQW SJ WM\ QIQFIVW [MXL ZEV]MRK TVSǻGMIRG] PIZIPW� 2] I\TIVMIRGI MR STXMQM^MRK [IF�FEWIH TVSHYGXW

Я использую следующий код:

Код: Выделить всё

Parser parser = new AutoDetectParser();
BodyContentHandler handler = new BodyContentHandler();
Metadata metadata = new Metadata();
parser.parse(fileData, handler, metadata, new ParseContext());

What could be the reason for that, and how can it be fixed?
I may open this PDF file with no issues with an external viewer.

Источник: https://stackoverflow.com/questions/781 ... m-pdf-file

Гость

1 сообщение • Страница 1 из 1

Вернуться в «JAVA»