Мое задание состоит в том, чтобы прочитать HTML-файл и отфильтровать все HTML-tags и сохранить только значения (которые являются целыми числами) в массиве. Мне разрешено использовать только сканер и его методы. Я гуглил и обнаружил предложения об использовании .replace или некоторых существующих функциях, которые легко удаляют все HTML-Tags, но, к сожалению, мне не разрешают использовать его. < /p>
Это то, что я сделал до сих пор. Каждая таблица начинается с линии «00-01», «01-02», «02-03» и так далее. Я использую это в качестве разделителя, и приведенный ниже код печатает только HTML-код между 2 таблицами. < /p>
public static void getEightDays(int[][] data) throws Exception {
URL url = new URL(nordpoolURL);
Scanner scan = new Scanner(new InputStreamReader(url.openStream()));
while (scan.findInLine("00-01") == null) {
scan.nextLine();
}
while (scan.findInLine("01-02") == null) {
System.out.println(scan.nextLine());
}
}
< /code>
это дает мне следующее; < /p>
11872
12146
12861
12561
13493
13386
12732
12249
< /code>
Вот полный HTML-код веб-сайта, который я пытаюсь прочитать. Кроме того, с моим способом сделать это, у меня должно было быть 24, в то время как петли, так как есть 24 ряда данных, и это кажется неэффективным, и что, вероятно, есть более простой способ сделать это. < /p>
Пожалуйста, помогите мне, указав мне в правильном направлении! Спасибо.
Подробнее здесь: https://stackoverflow.com/questions/382 ... ay-in-java