Извлечение текста из PDF на арабском языке и обратный текстPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Извлечение текста из PDF на арабском языке и обратный текст

Сообщение Anonymous »

Я сделал сценарий Python, который принимает PDF с фразами и извлекая их в колоду ANKI. Сценарий отлично работал с не семитскими языками, но когда кто -то попросил меня сделать подобную колоду на арабском языке, я столкнулся с проблемой. На арабском языке вы пишете справа налево, но предложение, которое я получаю, написано слева, чтобы написать. Это должно быть что -то в фазе извлечения, которым нужно что -то дополнительное для работы с полутовыми языками, я просто не знаю, что это такое. get:
pretence = "ar. (ةناشطع ♀) ناشطع نينكلو (ةعئاج تسل ♀) ، اعئاج تسل" < /p>
Я использовал pypdf2, чтобы извлечь текст и попробовать арабский риш 2.1.4 и python-bid Я также попробовал Обратный в различных формах, но это также меняет знаки пунктуации, такие как «(".
Есть идеи?

Подробнее здесь: https://stackoverflow.com/questions/750 ... wards-text
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Извлечение текста из PDF на арабском языке и получение текста задом наперед
    Anonymous » » в форуме Python
    0 Ответы
    17 Просмотры
    Последнее сообщение Anonymous
  • Почему обратный адрес Geocoder Locale.US на арабском языке в Дубае
    Anonymous » » в форуме Android
    0 Ответы
    12 Просмотры
    Последнее сообщение Anonymous
  • Itext Html в PDF Текст на арабском языке не работает
    Anonymous » » в форуме C#
    0 Ответы
    32 Просмотры
    Последнее сообщение Anonymous
  • Itext Html в PDF Текст на арабском языке не работает
    Anonymous » » в форуме C#
    0 Ответы
    26 Просмотры
    Последнее сообщение Anonymous
  • PDFBOX: почему текст на арабском языке, прочитанный из PDF, перемешивается, хотя в List<String> он выглядит в порядке пр
    Anonymous » » в форуме JAVA
    0 Ответы
    21 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»