Я сделал сценарий Python, который принимает PDF с фразами и извлекая их в колоду ANKI. Сценарий отлично работал с не семитскими языками, но когда кто -то попросил меня сделать подобную колоду на арабском языке, я столкнулся с проблемой. На арабском языке вы пишете справа налево, но предложение, которое я получаю, написано слева, чтобы написать. Это должно быть что -то в фазе извлечения, которым нужно что -то дополнительное для работы с полутовыми языками, я просто не знаю, что это такое. get:
pretence = "ar. (ةناشطع ♀) ناشطع نينكلو (ةعئاج تسل ♀) ، اعئاج تسل" < /p>
Я использовал pypdf2, чтобы извлечь текст и попробовать арабский риш 2.1.4 и python-bid Я также попробовал Обратный в различных формах, но это также меняет знаки пунктуации, такие как «(".
Есть идеи?
Подробнее здесь: https://stackoverflow.com/questions/750 ... wards-text
Извлечение текста из PDF на арабском языке и обратный текст ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Извлечение текста из PDF на арабском языке и получение текста задом наперед
Anonymous » » в форуме Python - 0 Ответы
- 17 Просмотры
-
Последнее сообщение Anonymous
-