Тика возвращает искаженный текст из PDF-файлаJAVA

Программисты JAVA общаются здесь
Ответить
Гость
 Тика возвращает искаженный текст из PDF-файла

Сообщение Гость »


Я преобразую PDF-файлы в TXT. Большинство PDF-файлов работают нормально, но один из них возвращает только искаженный текст, например:

Код: Выделить всё

� . LEZI E TVSZIR XVEGO VIGSVH SJ PIEHMRK ERH QIR�
XSVMRK XIEQW SJ WM\ QIQFIVW [MXL ZEV]MRK TVSǻGMIRG] PIZIPW� 2] I\TIVMIRGI MR STXMQM^MRK [IF�FEWIH TVSHYGXW
Я использую следующий код:

Код: Выделить всё

Parser parser = new AutoDetectParser();
BodyContentHandler handler = new BodyContentHandler();
Metadata metadata = new Metadata();
parser.parse(fileData, handler, metadata, new ParseContext());
What could be the reason for that, and how can it be fixed?
I may open this PDF file with no issues with an external viewer.


Источник: https://stackoverflow.com/questions/781 ... m-pdf-file
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «JAVA»