Как анализировать файлы Word с текстом на хинди шрифтом KrutiDev, используя Python в jsonPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как анализировать файлы Word с текстом на хинди шрифтом KrutiDev, используя Python в json

Сообщение Anonymous »

Я пытаюсь проанализировать файлы Word .docx, содержащие текст на хинди, написанный шрифтом KrutiDev 010.
Когда я обрабатываю текст с помощью Python и попытаюсь закодировать его в JSON, вместо ожидаемого текста на хинди я получу случайную тарабарщину.
Вот что у меня получилось сделано на данный момент:
  • Я использовал параметр обеспечения_ascii=False в функции json.dump(), чтобы разрешить Кодировка Unicode, поскольку кодировщик Python JSON по умолчанию использует ASCII.
  • Несмотря на это, выходные данные по-прежнему неверно и не отображает хинди текст правильно.
Я подозреваю, что эта проблема связана со шрифтом KrutiDev.
когда Я поместил эту тарабарщину в этот конвертер, и он дал мне правильный текст на хинди:
конвертер krutidev в Unicode
Как я могу правильно разобрать и закодировать текст на хинди в KrutiDev в Unicode и сохранить в файлах JSON?
Существуют ли какие-либо библиотеки или методы Python для обработки такого шрифта -специфические кодировки эффективно?

Подробнее здесь: https://stackoverflow.com/questions/792 ... on-in-json
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»