Как удалить неверные шестнадцатеричные символы из источника данных на основе XML до построения XMLreader или XPathDocume

Как удалить неверные шестнадцатеричные символы из источника данных на основе XML до построения XMLreader или XPathDocume ⇐ C#

1 сообщение • Страница 1 из 1

Anonymous

Как удалить неверные шестнадцатеричные символы из источника данных на основе XML до построения XMLreader или XPathDocume

Цитата

Сообщение Anonymous » 07 фев 2025, 22:13

Есть ли какой-либо простой/общий способ очистить источник данных на основе XML до использования его в XMLreader, чтобы я мог изящно употреблять данные XML, которые являются неконформирующими для шестнадцатеричных ограничений символов, наложенных на XML?

Примечание: < /p>

Решение должно обрабатывать XML
Источники данных, которые используют символ
Кодировки, отличные от UTF-8, например,
Указание символов, кодирующего символ, в
объявление о документе XML. Не
, искажая персонаж, кодирующий
источник при снятии недействительных
hexadecimal символов, была основной точкой приливления
< /li>
Удаление Неверные шестнадцатеричные символы должны удалять только шестнадцатеричные кодируемые значения, так как вы часто можете найти значения hREF в данных, которые содержит строку, которая будет соответствовать строке для шестнадцатеричного символа.

faning: < /em> < /p>

Мне нужно потреблять источник данных на основе XML, который соответствует определенному формату ( Подумайте о каналах Atom или RSS), но хочу иметь возможность потреблять источники данных, которые были опубликованы, которые содержат недействительные шестнадцатеричные символы в соответствии с XML -спецификацией. < /p>

in .net, если вы Иметь поток, который представляет источник данных XML, а затем попытаться проанализировать его, используя XMLreader и/или XPathDocument, исключение поднимается из -за включения недействительных шестнадцатеричных символов в данные XML. Моя текущая попытка решить эту проблему состоит в том, чтобы проанализировать поток как строку и использовать регулярное выражение для удаления и/или замены недействительных шестнадцатеричных символов, но я ищу более эффективное решение.

Подробнее здесь: https://stackoverflow.com/questions/207 ... a-source-p

1738955631

Anonymous

 Есть ли какой-либо простой/общий способ очистить источник данных на основе XML до использования его в XMLreader, чтобы я мог изящно употреблять данные XML, которые являются неконформирующими для шестнадцатеричных ограничений символов, наложенных на XML? 

Примечание: < /p>

[list]
[*] Решение должно обрабатывать XML
Источники данных, которые используют символ
Кодировки, отличные от UTF-8, например,
Указание символов, кодирующего символ, в
объявление о документе XML. Не
, искажая персонаж, кодирующий
источник при снятии недействительных
hexadecimal символов, была основной точкой приливления
< /li>
 Удаление Неверные шестнадцатеричные символы должны удалять только шестнадцатеричные кодируемые значения, так как вы часто можете найти значения hREF в данных, которые содержит строку, которая будет соответствовать строке для шестнадцатеричного символа.
[/list]

 faning: < /em> < /p>

Мне нужно потреблять источник данных на основе XML, который соответствует определенному формату ( Подумайте о каналах Atom или RSS), но хочу иметь возможность потреблять источники данных, которые были опубликованы, которые содержат недействительные шестнадцатеричные символы в соответствии с XML -спецификацией. < /p>

in .net, если вы Иметь поток, который представляет источник данных XML, а затем попытаться проанализировать его, используя XMLreader и/или XPathDocument, исключение поднимается из -за включения недействительных шестнадцатеричных символов в данные XML. Моя текущая попытка решить эту проблему состоит в том, чтобы проанализировать поток как строку и использовать регулярное выражение для удаления и/или замены недействительных шестнадцатеричных символов, но я ищу более эффективное решение.  

Подробнее здесь: [url]https://stackoverflow.com/questions/20762/how-do-you-remove-invalid-hexadecimal-characters-from-an-xml-based-data-source-p[/url]