Код: Выделить всё
{
"description": "This is an ellipsis: \u2026"
}
Код: Выделить всё
final byte[] d = description.getBytes(Charset.forName("ISO-8859-15"));
Я ищу способ преобразования неподдерживаемых символов Юникода в разумный символ или набор символов, поддерживаемый ISO-8859-15/Latin9. Здесь я ожидал бы три точки.
Примеры других символов, присутствующих во входных данных, и ожидаемый аналог:
Код: Выделить всё
\u2013 -> – -> -
\u2018 -> ‘ -> '
\u2019 -> ’ -> '
\u201c -> “ -> "
\u201d -> ” -> "
\u2022 -> • -> .
Есть ли класс JDK или внешняя библиотека, которая можно сделать конвертацию?
Подробнее здесь: https://stackoverflow.com/questions/787 ... n9-variant