У меня есть этот URL:
https://www.derstandard.at/search?n=&fd ... pleобразно src = "https://i.sstatic.net/v0tyoso7.png"/>
Я заинтересован в номере 71 (который кружит красным). Я думаю, что большая часть контента передается на сервере или каким-то образом извлечена. Сначала я попробовал rselenium , так как я больше знаком с R. Все же, но на моем Arm Mac я не мог подключиться к серверу на Localhost ...
Я теперь использую Playwright с узлом, чтобы каким -то образом получить этот номер. И все же я все еще терпеть неудачу. Мой скрипт выглядит так: < /p>
Код: Выделить всё
const { firefox } = require("playwright");
(async () => {
// Launch Firefox in headless mode
const browser = await firefox.launch({ headless: false });
const page = await browser.newPage();
// Navigate to the website
const url =
"https://www.derstandard.at/search?n=&fd=2025-02-17&td=2025-03-06&s=score&query=ukraine";
await page.goto(url, { waitUntil: "domcontentloaded" });
// Check if the button exists before trying to click
const buttonSelector = ".message-component";
if (await page.$(buttonSelector)) {
console.log("Clicking the button...");
await page.click(buttonSelector);
await page.waitForTimeout(2000); // Wait a bit for content to update
} else {
console.log("Button not found, continuing...");
}
// Extract all elements
const h1s = await page.evaluate(() =>
Array.from(document.querySelectorAll("h1")).map((el) => el.innerText.trim())
);
console.log("Extracted elements:", h1s);
// Close the browser
await browser.close();
})();
Как я должен нажать на кнопку «Бр/>
». /> Если у кого -то есть представление о том, как я программатически могу получить этот номер, это было бы очень высоко оценено!
Подробнее здесь: https://stackoverflow.com/questions/794 ... b-scraping
Мобильная версия