Манипуляции со строками. Можно ли удалить непредвиденные лишние пробелы в выходном тексте Google Cloud Vision OCR? - Цифровое Кемерово

Манипуляции со строками. Можно ли удалить непредвиденные лишние пробелы в выходном тексте Google Cloud Vision OCR? ⇐ C#

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Манипуляции со строками. Можно ли удалить непредвиденные лишние пробелы в выходном тексте Google Cloud Vision OCR?

Цитата

Сообщение Anonymous » 18 ноя 2024, 15:20

В настоящее время имеются непредвиденные дополнительные пробелы, как в двух примерах ниже (результат OCR). И Google на данный момент не завершил это исправление;
Поэтому мы ищем постобработку (выполните манипуляцию со строками из результата OCR); к ожидаемому результату).
Однако, по моему опыту, я не вижу логики, чтобы покрыть все непредвиденные лишние пробелы.
Не могли бы вы помочь мне подсказать и поправить, пожалуйста, большое спасибо.
Образец 1:

Результат OCR: НАТУРАЛЬНЫЙ ВИТАМИН Е 400 МЕГА КАПСУЛА 400 МЕ Принимать по 1 таблетке за раз 1 раз в день после завтрака. Возраст в течение 1 года с момента получения

Ожидаемый результат (Если смотреть глазами человека): НАТУРАЛЬНЫЙ ВИТАМИН Е. 400 МЕГА КАПСУЛЫ 400 МЕ, принимать по 1 таблетке 1 раз в день после завтрака. Срок годности этого лекарства истекает в течение 1 года с даты получения.

Образец 2:

Результат OCR: MOLAX - M TABLET 10 МГ, принимать по 1 таблетке 3 раза в день перед завтраком, обедом и ужином. Препарат для лечения тошноты, рвоты и регулирования перистальтики пищеварительного тракта.

Ожидаемый результат (если смотреть глазами человека): МОЛАКС - ТАБЛЕТКА М 10 мг Принимать по 1 таблетке за раз 3 раза в день перед завтраком, обедом и ужином. Лекарство для облегчения тошноты и рвоты. Наладить перистальтику желудочно-кишечного тракта. Это лекарство следует принимать за полчаса до еды.

Подробнее здесь: https://stackoverflow.com/questions/791 ... s-in-outpu

1731932453

Anonymous

В настоящее время имеются непредвиденные дополнительные пробелы, как в двух примерах ниже (результат OCR). И Google на данный момент не завершил это исправление;
Поэтому мы ищем постобработку (выполните манипуляцию со строками из результата OCR); к ожидаемому результату).
Однако, по моему опыту, я не вижу логики, чтобы покрыть все непредвиденные лишние пробелы.
Не могли бы вы помочь мне подсказать и поправить, пожалуйста, большое спасибо.
[b]Образец 1:[/b]

Результат OCR: НАТУРАЛЬНЫЙ ВИТАМИН Е 400 МЕГА КАПСУЛА 400 МЕ Принимать по 1 таблетке за раз 1 раз в день после завтрака. Возраст в течение 1 года с момента получения

Ожидаемый результат (Если смотреть глазами человека): НАТУРАЛЬНЫЙ ВИТАМИН Е. 400 МЕГА КАПСУЛЫ 400 МЕ, принимать по 1 таблетке 1 раз в день после завтрака. Срок годности этого лекарства истекает в течение 1 года с даты получения.

[b]Образец 2:[/b]

Результат OCR: MOLAX - M TABLET 10 МГ, принимать по 1 таблетке 3 раза в день перед завтраком, обедом и ужином. Препарат для лечения тошноты, рвоты и регулирования перистальтики пищеварительного тракта.

Ожидаемый результат (если смотреть глазами человека): МОЛАКС - ТАБЛЕТКА М 10 мг Принимать по 1 таблетке за раз 3 раза в день перед завтраком, обедом и ужином. Лекарство для облегчения тошноты и рвоты. Наладить перистальтику желудочно-кишечного тракта. Это лекарство следует принимать за полчаса до еды.

Подробнее здесь: [url]https://stackoverflow.com/questions/79180171/string-manipulation-is-it-possible-to-remove-unpredicted-extra-spaces-in-outpu[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «C#»