Бесплатные альтернативы IronOCR для извлечения сведений о водительских правах в .NET + проблемы конфиденциальности

Бесплатные альтернативы IronOCR для извлечения сведений о водительских правах в .NET + проблемы конфиденциальности ⇐ C#

1 сообщение • Страница 1 из 1

Anonymous

Бесплатные альтернативы IronOCR для извлечения сведений о водительских правах в .NET + проблемы конфиденциальности

Сообщение Anonymous » 13 май 2026, 12:54

Я работаю над .NET-приложением, в котором мне нужно извлекать структурированную информацию из изображений/PDF-файлов водительских прав, а именно:

Номер лицензии
Дата выдачи
Срок действия

В настоящее время Я использую IronOCR, но бесплатная/пробная версия не обеспечивает надежное извлечение всех полей, а коммерческая лицензия для моего варианта использования дорогая.
Вот упрощенная версия моей текущей реализации:

Код: Выделить всё

public async Task ReadLicenseAsync(string imagePath)
{
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;

using OcrInput input = new OcrInput(imagePath);

OcrResult result = await Task.Run(() => ocr.Read(input));

string text = result.Text;

Match licenseMatch = Regex.Match(text, @"[A-Z0-9]{6,15}");

MatchCollection dates = Regex.Matches(text, @"\d{2}/\d{2}/\d{4}");

return text;
}

Оптическое распознавание текста работает частично, но поля часто пропускаются или извлекаются неправильно в зависимости от качества изображения и формата документа.
Мне нужны рекомендации по:

Бесплатным библиотекам оптического распознавания символов с открытым исходным кодом, которые хорошо работают с C#/.NET для извлечения данных из водительских прав или документов, удостоверяющих личность.
Методы улучшения оптического распознавания символов точность для зашумленных изображений или изображений, отсканированных с помощью мобильных устройств.
Соображения безопасности и конфиденциальности при использовании библиотек оптического распознавания символов для конфиденциальных документов, таких как водительские права.

Обрабатывают ли эти библиотеки данные полностью автономно/локально?
Существует ли риск загрузки данных извне, зарегистрировано или утекло?

Рекомендуемые рекомендации по безопасной обработке конфиденциальных данных оптического распознавания символов, таких как номера лицензий.

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «C#»