Есть ли какой-либо простой/общий способ очистить источник данных на основе XML до использования его в XMLreader, чтобы я мог изящно употреблять данные XML, которые являются неконформирующими для шестнадцатеричных ограничений символов, наложенных на XML?
Примечание: < /p>
Решение должно обрабатывать XML
Источники данных, которые используют символ
Кодировки, отличные от UTF-8, например,
Указание символов, кодирующего символ, в
объявление о документе XML. Не
, искажая персонаж, кодирующий
источник при снятии недействительных
hexadecimal символов, была основной точкой приливления
< /li>
Удаление Неверные шестнадцатеричные символы должны удалять только шестнадцатеричные кодируемые значения, так как вы часто можете найти значения hREF в данных, которые содержит строку, которая будет соответствовать строке для шестнадцатеричного символа.
faning: < /em> < /p>
Мне нужно потреблять источник данных на основе XML, который соответствует определенному формату ( Подумайте о каналах Atom или RSS), но хочу иметь возможность потреблять источники данных, которые были опубликованы, которые содержат недействительные шестнадцатеричные символы в соответствии с XML -спецификацией. < /p>
in .net, если вы Иметь поток, который представляет источник данных XML, а затем попытаться проанализировать его, используя XMLreader и/или XPathDocument, исключение поднимается из -за включения недействительных шестнадцатеричных символов в данные XML. Моя текущая попытка решить эту проблему состоит в том, чтобы проанализировать поток как строку и использовать регулярное выражение для удаления и/или замены недействительных шестнадцатеричных символов, но я ищу более эффективное решение.
Есть ли какой-либо простой/общий способ очистить источник данных на основе XML до использования его в XMLreader, чтобы я мог изящно употреблять данные XML, которые являются неконформирующими для шестнадцатеричных ограничений символов, наложенных на XML?
Примечание: < /p>
[list] [*] Решение должно обрабатывать XML Источники данных, которые используют символ Кодировки, отличные от UTF-8, например, Указание символов, кодирующего символ, в объявление о документе XML. Не , искажая персонаж, кодирующий источник при снятии недействительных hexadecimal символов, была основной точкой приливления < /li> Удаление Неверные шестнадцатеричные символы должны удалять только шестнадцатеричные кодируемые значения, так как вы часто можете найти значения hREF в данных, которые содержит строку, которая будет соответствовать строке для шестнадцатеричного символа. [/list]
faning: < /em> < /p>
Мне нужно потреблять источник данных на основе XML, который соответствует определенному формату ( Подумайте о каналах Atom или RSS), но хочу иметь возможность потреблять источники данных, которые были опубликованы, которые содержат недействительные шестнадцатеричные символы в соответствии с XML -спецификацией. < /p>
in .net, если вы Иметь поток, который представляет источник данных XML, а затем попытаться проанализировать его, используя XMLreader и/или XPathDocument, исключение поднимается из -за включения недействительных шестнадцатеричных символов в данные XML. Моя текущая попытка решить эту проблему состоит в том, чтобы проанализировать поток как строку и использовать регулярное выражение для удаления и/или замены недействительных шестнадцатеричных символов, но я ищу более эффективное решение.