Разбор HTML веб-сайта с помощью JAVA [дубликат]JAVA

Программисты JAVA общаются здесь
Ответить
Anonymous
 Разбор HTML веб-сайта с помощью JAVA [дубликат]

Сообщение Anonymous »

Я хочу проанализировать простой веб-сайт и получить информацию с этого веб-сайта.

Я использовал для анализа XML-файлов с помощью DocumentBuilderFactory, я пытался сделать то же самое для html-файла, но он всегда попадает в бесконечный цикл.

Код: Выделить всё

    URL url = new URL("http://www.deneme.com");
URLConnection uc = url.openConnection();

InputStreamReader input = new InputStreamReader(uc.getInputStream());
BufferedReader in = new BufferedReader(input);
String inputLine;

FileWriter outFile = new FileWriter("orhancan");
PrintWriter out = new PrintWriter(outFile);

while ((inputLine = in.readLine()) != null) {
out.println(inputLine);
}

in.close();
out.close();

File fXmlFile = new File("orhancan");
DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
Document doc = dBuilder.parse(fXmlFile);

NodeList prelist = doc.getElementsByTagName("body");
System.out.println(prelist.getLength());
В чем проблема? Или есть ли более простой способ получить данные с веб-сайта для определенного тега HTML?

Подробнее здесь: https://stackoverflow.com/questions/907 ... -with-java
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «JAVA»