Тика возвращает искаженный текст из PDF-файлаJAVA

Программисты JAVA общаются здесь
Ответить
Anonymous
 Тика возвращает искаженный текст из PDF-файла

Сообщение Anonymous »

Я преобразую PDF-файлы в TXT. Большинство PDF-файлов работают нормально, но один из них возвращает только искаженный текст, например:

Код: Выделить всё

� . LEZI E TVSZIR XVEGO VIGSVH SJ PIEHMRK ERH QIR�
XSVMRK XIEQW SJ WM\ QIQFIVW [MXL ZEV]MRK TVSǻGMIRG] PIZIPW� 2] I\TIVMIRGI MR STXMQM^MRK [IF�FEWIH TVSHYGXW
Я использую следующий код:

Код: Выделить всё

Parser parser = new AutoDetectParser();
BodyContentHandler handler = new BodyContentHandler();
Metadata metadata = new Metadata();
parser.parse(fileData, handler, metadata, new ParseContext());
В чем может быть причина этого и как это исправить?
Я могу без проблем открыть этот PDF-файл с помощью внешнего средства просмотра.

Подробнее здесь: https://stackoverflow.com/questions/781 ... m-pdf-file
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «JAVA»