- Номер лицензии
- Дата выдачи
- Срок действия
Вот упрощенная версия моей текущей реализации:
Код: Выделить всё
public async Task ReadLicenseAsync(string imagePath)
{
IronTesseract ocr = new IronTesseract();
ocr.Language = OcrLanguage.English;
using OcrInput input = new OcrInput(imagePath);
OcrResult result = await Task.Run(() => ocr.Read(input));
string text = result.Text;
Match licenseMatch = Regex.Match(text, @"[A-Z0-9]{6,15}");
MatchCollection dates = Regex.Matches(text, @"\d{2}/\d{2}/\d{4}");
return text;
}
Мне нужны рекомендации по:
- Бесплатным библиотекам оптического распознавания символов с открытым исходным кодом, которые хорошо работают с C#/.NET для извлечения данных из водительских прав или документов, удостоверяющих личность.
- Методы улучшения оптического распознавания символов точность для зашумленных изображений или изображений, отсканированных с помощью мобильных устройств.
- Соображения безопасности и конфиденциальности при использовании библиотек оптического распознавания символов для конфиденциальных документов, таких как водительские права.
- Обрабатывают ли эти библиотеки данные полностью автономно/локально?
- Существует ли риск загрузки данных извне, зарегистрировано или утекло?
- Рекомендуемые рекомендации по безопасной обработке конфиденциальных данных оптического распознавания символов, таких как номера лицензий.