Я пишу гусеница в Java, чтобы запустить некоторые веб -сайты, у которых могут быть некоторые персонажи Unicode, такие как «£». Когда я хранил контент (источник HTML) в струне Java, эти виды Chars теряются и заменяются вопросительным знаком "?". Я хотел бы знать, как сохранить их нетронутыми. Связанный код следующим образом: < /p>
protected String readWebPage(String weburl) throws IOException{
HttpClient httpclient = new DefaultHttpClient();
HttpGet httpget = new HttpGet(weburl);
ResponseHandler responseHandler = new BasicResponseHandler();
String responseBody = httpclient.execute(httpget, responseHandler);
// responseBody now contains the contents of the page
httpclient.getConnectionManager().shutdown();
return responseBody;
}
// function call
String res = readWebPage(url);
PrintWriter out = new PrintWriter(outDir+name+".html");
out.println(res);
out.close();
< /code>
, а затем при выполнении соответствия персонажа, я также хочу иметь возможность сделать что -то вроде: < /p>
if(text.indexOf("£")>=0)
< /code>
Я не знаю, узнает ли Java этот персонаж и сделает так, как я хочу, чтобы он сделал. < /p>
Любой вход будет высоко оценен. Заранее спасибо.
Подробнее здесь: https://stackoverflow.com/questions/295 ... ava-string