В настоящее время имеются непредвиденные дополнительные пробелы, как в двух примерах ниже (результат OCR). И Google на данный момент не завершил это исправление;
Поэтому мы ищем постобработку (выполните манипуляцию со строками из результата OCR); к ожидаемому результату).
Однако, по моему опыту, я не вижу логики, чтобы покрыть все непредвиденные лишние пробелы.
Не могли бы вы помочь мне подсказать и поправить, пожалуйста, большое спасибо.
Образец 1:
Результат OCR: НАТУРАЛЬНЫЙ ВИТАМИН Е 400 МЕГА КАПСУЛА 400 МЕ Принимать по 1 таблетке за раз 1 раз в день после завтрака. Возраст в течение 1 года с момента получения
Ожидаемый результат (Если смотреть глазами человека): НАТУРАЛЬНЫЙ ВИТАМИН Е. 400 МЕГА КАПСУЛЫ 400 МЕ, принимать по 1 таблетке 1 раз в день после завтрака. Срок годности этого лекарства истекает в течение 1 года с даты получения.
Образец 2:
Результат OCR: MOLAX - M TABLET 10 МГ, принимать по 1 таблетке 3 раза в день перед завтраком, обедом и ужином. Препарат для лечения тошноты, рвоты и регулирования перистальтики пищеварительного тракта.
Ожидаемый результат (если смотреть глазами человека): МОЛАКС - ТАБЛЕТКА М 10 мг Принимать по 1 таблетке за раз 3 раза в день перед завтраком, обедом и ужином. Лекарство для облегчения тошноты и рвоты. Наладить перистальтику желудочно-кишечного тракта. Это лекарство следует принимать за полчаса до еды.
Подробнее здесь: https://stackoverflow.com/questions/791 ... s-in-outpu
Манипуляции со строками. Можно ли удалить непредвиденные лишние пробелы в выходном тексте Google Cloud Vision OCR? ⇐ C#
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение