Но я не могу заставить его работать. Я хочу выполнить поиск по http://synchronkartei.de.
У меня есть следующий код: < /p>
Код: Выделить всё
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class SynchronkarteiScraper {
public static void main(String[] args) throws Exception{
Document doc = Jsoup.connect("https://www.synchronkartei.de/search.php")
.data("cat", "2")
.data("search", "Thomas Danneberg")
.data("action", "search")
.followRedirects(true)
.get();
Elements meta = doc.select("html head meta");
for (final Element m : meta){
if (m.attr("http-equiv").contains("refresh")){
doc = Jsoup.connect(m.baseUri()+m.attr("content").split("=")[1]).get();
}
}
System.out.println(doc.body().toString());
}
}
< /code>
Это выполняет поиск, который приводит к временному сайту, который обновляется, открывает страницу реального результата.
Это то же самое, что и перейти на http://synchronkartei.de, выбор «Sprecher» из Dropdownbox, введя «Thomas Danneberg» к текстовой и нажимая. Даже после извлечения URL -адреса обновления и выполнения второго соединения, я все еще получаю содержание временной целевой страницы, которое можно увидеть в принте тела. А поскольку он использует сертификат от Startcom, Java жалуется на путь сертификата. Чтобы пропустить вышеупомянутый фрагмент кода, необходимо использовать параметр VM -djavax.net.ssl.truststore =
Подробнее здесь: https://stackoverflow.com/questions/156 ... h-redirect