Бесплатные альтернативы IronOCR для извлечения сведений о водительских правах в .NET + проблемы конфиденциальности [закрC#

Место общения программистов C#
Anonymous
Бесплатные альтернативы IronOCR для извлечения сведений о водительских правах в .NET + проблемы конфиденциальности [закр

Сообщение Anonymous »

Я работаю над .NET-приложением, в котором мне нужно извлекать структурированную информацию из изображений/PDF-файлов водительских прав, а именно:
  • Номер лицензии
  • Дата выдачи
  • Срок действия
В настоящее время Я использую IronOCR, но бесплатная/пробная версия не обеспечивает надежное извлечение всех полей, а коммерческая лицензия для моего варианта использования дорогая.
Вот упрощенная версия моей текущей реализации:

Код: Выделить всё

public async Task ReadLicenseAsync(string imagePath)
{
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;

using OcrInput input = new OcrInput(imagePath);

OcrResult result = await Task.Run(() => ocr.Read(input));

string text = result.Text;

Match licenseMatch = Regex.Match(text, @"[A-Z0-9]{6,15}");

MatchCollection dates = Regex.Matches(text, @"\d{2}/\d{2}/\d{4}");

return text;
}
Оптическое распознавание текста работает частично, но поля часто пропускаются или извлекаются неправильно в зависимости от качества изображения и формата документа.
Мне нужны рекомендации по бесплатным библиотекам оптического распознавания символов с открытым исходным кодом, которые хорошо работают с C#/.NET для извлечения данных из водительских прав или документов, удостоверяющих личность.>

Вернуться в «C#»