PDFBox 2 Проблема со колонкой Как проверить бусиныJAVA

Программисты JAVA общаются здесь
Ответить
Anonymous
 PDFBox 2 Проблема со колонкой Как проверить бусины

Сообщение Anonymous »

У меня есть http://laws-lois.justice.gc.ca/PDF/A-8.8.pdf, который я пытаюсь проанализировать с помощью PDFBox, который имеет 2 столбца. Я хочу, чтобы текст анализировался так, чтобы столбцы были разделены, однако, когда я запускаю его через PDFBox, он не разделяет два столбца, а объединяет строки из обоих столбцов вместе.

Я прочитал https://issues.apache.org/jira/browse/PDFBOX-448, в котором говорится, что в некоторых PDF-файлах нет статей/бусинок, которые могут использоваться, и поэтому синтаксический анализ всегда будет неправильным. Я пробовал использовать Stripper.setShouldSeparateByBeads(true)

Как я могу проверить, есть ли у него бусины или нет? Я не нашел никаких материалов для чтения по этой концепции, за исключением вопросов о синтаксическом анализе столбцов PDFBox.

Подробнее здесь: https://stackoverflow.com/questions/398 ... heck-beads
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «JAVA»