Я хочу преобразовать весь возможный текст + операторы + апостроф (также похожие символы).
Как могу ли я добиться такого результата?
Какое максимальное количество символов я могу преобразовать из Unicode в Ascii?
Код: Выделить всё
String normalized = Normalizer.normalize(unicodeStr, Normalizer.Form.NFD);
String asciiStr = normalized.replaceAll("[^\\p{ASCII}-']");
Пример строки: ʼ-- ŤḪÍŚ ÍŚ Á ŤÁŤÉḾÉŤ −−ʼ
Ожидаемый результат: '-- ЭТО ЗАЯВЛЕНИЕ --'
Фактический результат: ʼ-- ЭТО ЗАЯВЛЕНИЕ --'
Обратите внимание, что апостроф и знак минус не преобразуются в свои аналоги в ascii.
Подробнее здесь: https://stackoverflow.com/questions/785 ... ii-in-java
Мобильная версия