Я читаю твиты и формирую из него XML, для которого я использую кодирование Jaxb Marshaller и UTF-8. p>
JAXBContext jaxbContext;
StringWriter writer = new StringWriter();
jaxbContext = JAXBContext.newInstance(obj.getClass());
Marshaller m = jaxbContext.createMarshaller();
m.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true);
m.marshal(obj, writer);
< /code>
Здесь, obj < /code> - мой объект класса, который содержит текст твита и другую информацию. < /p>
my my Проблема в том, что сгенерированный XML содержит специальные символы, такие как: < /p>
> x85, x93, xAQ
< /code>
Пример вывода xml: < /p>
500923859663872000
2014-08-17T14:05:29+05:30
**Ԁhughwizzy: 55% of all '14-'15 @PremierLeague players will wear @Nike** Boots. (@adidas 35%, @Puma 5%). http://t.co/VHit1Es7KlԠ@Yup_Yup9
en
NA
0
0
false
39481349
2009-05-12T17:12:37+05:30
NA
281
4
en
false
false
< /code>
Я обнаружил, что это кодированные символы UTF-8, но это делает мой XML недействительным. < /p>
Есть способ избежать этих символов в сгенерированном XML.
Подробнее здесь: https://stackoverflow.com/questions/253 ... using-jaxb