Как обрабатывать изменения длины из-за нормализации (NFKC для моего варианта использования)? - Цифровое Кемерово

Как обрабатывать изменения длины из-за нормализации (NFKC для моего варианта использования)? ⇐ C++

1 сообщение • Страница 1 из 1

Anonymous

Как обрабатывать изменения длины из-за нормализации (NFKC для моего варианта использования)?

Сообщение Anonymous » 10 май 2024, 08:33

Нормализация не всегда приводит к сопоставлению символов 1-1. Такие символы, как «фи», преобразуются в «фи», а некоторые японские/китайские символы могут объединяться в один символ. Мне нужен способ сопоставить смещения между нормализованными и исходными строками. Существует ли какая-либо библиотека или метод для точного решения этой проблемы?
Использование приближений путем поиска окружающих символов, на которые не влияет нормализация, таких как английские буквы и пробелы, помогает, но недостаточно точно. .

Подробнее здесь: https://stackoverflow.com/questions/784 ... y-use-case

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «C++»