Извлечение текста из PDF на арабском языке и получение текста задом напередPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Извлечение текста из PDF на арабском языке и получение текста задом наперед

Сообщение Anonymous »

Я написал скрипт на Python, который берет PDF-файл с фразами и извлекает их в колоду Anki. Сценарий отлично работал с несемитскими языками, но когда кто-то попросил меня сделать аналогичную колоду на арабском языке, я столкнулся с проблемой. На арабском языке вы пишете справа налево, но предложение, которое я получаю, написано слева. Должно быть, что-то на этапе извлечения требует чего-то дополнительного для работы с семитскими языками, я просто не знаю, что это такое.
Пример:
Самый текст:
Изображение

Текст, который я получил:
предложение = "AR.(ةناشطع ♀) ناشطع نينكلو (ةعئاج تسل ♀) ،اعئاج تسل"
Я использовал PyPDF2 для извлечения текста и попробовал arabic-reshaper 2.1.4 и python-bidi, чтобы решить эту проблему, но безрезультатно. Я также пробовал перевернуть в различных формах, но он также меняет местами знаки препинания, такие как "(".
Есть идеи?

Подробнее здесь: https://stackoverflow.com/questions/750 ... wards-text
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Извлечение текста из PDF на арабском языке и обратный текст
    Anonymous » » в форуме Python
    0 Ответы
    2 Просмотры
    Последнее сообщение Anonymous
  • Как вернуть массив для отображения задом наперед
    Anonymous » » в форуме JAVA
    0 Ответы
    17 Просмотры
    Последнее сообщение Anonymous
  • C# Вставка массива в строку задом наперед
    Anonymous » » в форуме C#
    0 Ответы
    12 Просмотры
    Последнее сообщение Anonymous
  • Прочитайте файл задом наперед, построчно, используя fseek.
    Anonymous » » в форуме Php
    0 Ответы
    16 Просмотры
    Последнее сообщение Anonymous
  • Прочитайте файл задом наперед, построчно, используя fseek.
    Anonymous » » в форуме Php
    0 Ответы
    11 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»