Код: Выделить всё
static private String bytesToHex(byte[] in) {
final StringBuilder builder = new StringBuilder();
for(byte b : in) {
builder.append(String.format("%02x", b));
}
return builder.toString();
}
static private String normalize(String str) {
System.out.println("Normalize " + str + " / hex " + bytesToHex(str.getBytes(StandardCharsets.UTF_8)));
// ...
}
- Локальный вывод: «Нормализовать ë / hex c3ab» (как и ожидалось)
< li>Вывод клиента: «Нормализовать ë / hex c383c2ab» !!!
Есть идеи, как это могло произойти?
Редактировать: хорошо, решено. На самом деле строка содержала «Ã», но журнал клиента был записан в ISO, и я читал его в режиме UTF8, поэтому в итоге у меня получилось «ë». Теперь о том, почему str содержит это: оно происходит из вызова REST, и, очевидно, строка new InputStreamReader(conn.getInputStream()) использовала UTF8 в моей системе и ISO в других! Таким образом, исправление состоит в том, чтобы указать UTF8 в конструкторе. Куча странных проблем накапливается.
Подробнее здесь: https://stackoverflow.com/questions/789 ... ue-in-java
Мобильная версия