Я преобразую PDF-файлы в TXT. Большинство PDF-файлов работают нормально, но один из них возвращает только искаженный текст, например:
Код: Выделить всё
� . LEZI E TVSZIR XVEGO VIGSVH SJ PIEHMRK ERH QIR�
XSVMRK XIEQW SJ WM\ QIQFIVW [MXL ZEV]MRK TVSǻGMIRG] PIZIPW� 2] I\TIVMIRGI MR STXMQM^MRK [IF�FEWIH TVSHYGXW
Код: Выделить всё
Parser parser = new AutoDetectParser();
BodyContentHandler handler = new BodyContentHandler();
Metadata metadata = new Metadata();
parser.parse(fileData, handler, metadata, new ParseContext());
I may open this PDF file with no issues with an external viewer.
Источник: https://stackoverflow.com/questions/781 ... m-pdf-file