Как расставить приоритеты на французском OCR по арабскому языку при использовании Tesseract (FRA+ARA) на двуязычных доку

Как расставить приоритеты на французском OCR по арабскому языку при использовании Tesseract (FRA+ARA) на двуязычных доку ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как расставить приоритеты на французском OCR по арабскому языку при использовании Tesseract (FRA+ARA) на двуязычных доку

Цитата

Сообщение Anonymous » 28 апр 2025, 14:01

Я работаю над отсканированными документами (регистрами), которые содержат как французский и арабский текст.
Когда я запускаю tesseract ocr с lang = 'fra' , все французский текст извлечен идеально . Чтобы справиться с обоими языками в одном проходе, я начинаю получать странные ошибки:

Французские слова неверно прочитаны или заменены (например, Societe становится 50012175 )
Имена французской компании становятся случайными арабскими символами (например, Alpha . حمناطاحم )
арабские слова работают нормально, но французский язык развращается.

Что я хочу:
Я хотел бы, чтобы tesseract приоритет в арабском языке (на самом деле, когда он смотрит на французский, и только что в арабском языке). Текст. < /p>
Я попытался сделать OCR в двух проходах (

Код: Выделить всё

fra

и ara ) и комбинировать их вручную, но трудно правильно согласовать слова, так как Tesseract разбивает и заказывает текст по -разному для арабского и французского. to:

Расстановка приоритетов fra over ara во время одного запуска OCR? Выходы? Python
Вход OCR: сканирующие PDFS/Images (высокое качество)
образец изображения

Подробнее здесь: https://stackoverflow.com/questions/795 ... a-on-bilin

1745838081

Anonymous

 Я работаю над отсканированными документами (регистрами), которые содержат как [b] французский [/b] и [b] арабский [/b] текст. 
Когда я запускаю tesseract ocr с lang = 'fra' , все [b] французский текст извлечен идеально [/b]. Чтобы справиться с обоими языками в одном проходе, я начинаю получать странные ошибки: 
[list]
[*] Французские слова неверно прочитаны или заменены (например, Societe  становится 50012175 )
[*] Имена французской компании становятся случайными арабскими символами (например, Alpha . حمناطاحم )
[*] арабские слова работают нормально, но французский язык развращается.
[/list]
 Что я хочу: 
Я хотел бы, чтобы tesseract  приоритет в арабском языке (на самом деле, когда он смотрит на французский, и только что в арабском языке). Текст. < /p>
Я попытался сделать OCR в двух проходах ([code]fra[/code] и ara ) и комбинировать их вручную, но трудно правильно согласовать слова, так как Tesseract разбивает и заказывает текст по -разному для арабского и французского. to: 
[list]
[*] Расстановка приоритетов fra  over ara  во время одного запуска OCR? Выходы? Python
[*] Вход OCR: сканирующие PDFS/Images (высокое качество)
образец изображения
[/list] 

Подробнее здесь: [url]https://stackoverflow.com/questions/79553473/how-to-prioritize-french-ocr-over-arabic-when-using-tesseract-fraara-on-bilin[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как расставить приоритеты на французском OCR по арабскому языку при использовании Tesseract (FRA+ARA) на двуязычных доку

Последнее сообщение Anonymous « 23 апр 2025, 12:22
Добавлено в форуме Python

Anonymous » 23 апр 2025, 12:22 » в форуме Python

Я работаю над отсканированными документами (регистрами), которые содержат как французский и арабский текст.
Когда я запускаю tesseract ocr с lang = 'fra' , все французский текст извлечен идеально . Чтобы справиться с обоими языками в одном проходе,...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
23 апр 2025, 12:22
Вложенные циклы Java. Есть ли способ расставить приоритеты при выполнении строки кода [закрыто]

Последнее сообщение Anonymous « 16 сен 2024, 15:11
Добавлено в форуме JAVA

Anonymous » 16 сен 2024, 15:11 » в форуме JAVA

public void deploy(){

while (true) {

if (isFrontClear() && !isBoundary()) {

move();

System.out.println( basic moving );

while(isFacingNorth() || isFacingSouth() || isFacingWest()){

System.out.println( entering first while loop );...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 15:11
Как расставить приоритеты в определенных элементах по стоимости при сортировке ассоциативного массива?

Последнее сообщение Anonymous « 11 мар 2025, 05:08
Добавлено в форуме Php

Anonymous » 11 мар 2025, 05:08 » в форуме Php

У меня есть множество стран, которые я буду использовать в выбранном меню:
array(
=> -- Select --
=> Afghanistan
=> Albania
=> Algeria
=> Canada
=> USA
//etc...
)

Я хочу скопировать создание копий записей Канады и США и поместить их в...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
11 мар 2025, 05:08
Как расставить приоритеты разделенных символов в ISplitCharacters в iText 7

Последнее сообщение Anonymous « 22 июл 2024, 17:56
Добавлено в форуме C#

Anonymous » 22 июл 2024, 17:56 » в форуме C#

Работая с разделяемыми символами iText 7, я хочу, чтобы строка, которую нужно разбить, всегда разбивалась на дефисы или пробелы, если они существуют, независимо от местоположения этого символа, а если их нет, то она разбивалась на какой-либо символ....

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
22 июл 2024, 17:56
Как расставить приоритеты в механизмах синхронизации, работающих с общими данными в Android?

Последнее сообщение Anonymous « 12 дек 2024, 12:26
Добавлено в форуме Android

Anonymous » 12 дек 2024, 12:26 » в форуме Android

У меня есть приложение для Android с тремя различными механизмами синхронизации, которые работают независимо, каждый из которых использует свой собственный CoroutineScope. Все эти синхронизации зависят от данных одного и того же типа (например,...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 12:26

Вернуться в «Python»