Стандартизировать/нормализовать HTML -символ сбегает на JavaHtml

Программисты Html
Ответить
Anonymous
 Стандартизировать/нормализовать HTML -символ сбегает на Java

Сообщение Anonymous »

Я пытаюсь сравнить фрагменты HTML, которые были обработаны двумя разными системами, чтобы убедиться, что результаты эквивалентны, в частности, в отношении побега персонажа. Мне нужна версия фрагмента, который все еще пройдет и отображается, но чей символ сбегает в канонической/стандартизированной форме (какой бы формы ни была).
Например, я хотел бы À , À , À
Я имею доступ к Apache.commons.text, в котором я нашел числовое значение, которое выполняет задачу, чтобы соответствовать численным эскапам для stringScapeutils.unescapehtml4, что, к сожалению, что это возвращает. Но то, что я хочу, это все еще сбежавший символ, только стандартный побег, и если я передам полностью невозможную строку в stringScapeUtils.escapehtml4, функция не может рассказать о недавно неэскапированном

Подробнее здесь: https://stackoverflow.com/questions/797 ... es-in-java
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Html»