Я попытался использовать Python и Beautifulsoup, чтобы вырвать веб -сайт коммерческой недвижимости с соответствующим HREF, также показанным в последнем списке CSV. Но столбец ссылки всегда показан пустым. Как я мог извлечь HREF и запланировать эту задачу, выполняющую весь веб -сайт еженедельно? Спасибо заранее! < /P>
Я попытался использовать Python и Beautifulsoup, чтобы вырвать веб -сайт коммерческой недвижимости с соответствующим HREF, также показанным в последнем списке CSV. Но столбец ссылки всегда показан пустым. Как я мог извлечь HREF и запланировать эту задачу, выполняющую весь веб -сайт еженедельно? Спасибо заранее! < /P> [code]from bs4 import BeautifulSoup import requests from csv import writer import re
with open('lokal_stockholm_city_v11.csv', 'w', encoding='utf8', newline='') as f: thewriter = writer(f) header = ['title', 'location', 'area','link'] thewriter.writerow(header)
for list in lists: title = list.find('div', class_="font-weight-bold text-ov street-address").text.replace('\r\n','') location = list.find('div', class_="text-ov-dark-grey area-address").text.replace('\r\n','') area = list.find('div', class_="font-weight-bold size").text.replace('\r\n','') link =list.find('a', attrs_={'href': re.compile("^https://objektvision.se/Beskriv/")})
info = [title,location, area,link] thewriter.writerow(info) [/code] Окончательный CSV выглядит так
Я просканировал веб-сайт, но у меня возникла проблема со специальным тегом, который не возвращает ответ. Я получаю HTML-документ, отправляя запрос, а затем анализирую его с помощью BS4. Однако, когда я использую метод find, он не дает никаких...
Я пытаюсь соскрести результаты поиска на Walmart. Python.
Я попробовал Selenium , и меня попросят проверить мою личность. Я пробовал запросы и получаю запрещенную страницу от Walmart. Я пробовал другие библиотеки, и у меня заканчиваются идеи. Есть...
Я пытаюсь сделать междоменный запрос для получения HTML-кода, его кэширования, а затем перебора кэшированного HTML-кода, чтобы извлечь данные и в конечном итоге поместить их на страницу. Это работает, но тратит HTTP-запросы.
Я новичок в PHP и создаю веб-скребок для проекта. С этого веб-сайта я считываю название блога, URL-адрес блога, URL-адрес изображения и объединяю ссылку для последующего использования. Как вы можете видеть на странице, есть несколько полей с...
Наконец-то я заставил IntelliJ работать. Я использую код ниже. Он работает идеально. Мне нужно, чтобы он снова и снова выдергивал ссылки из электронной таблицы, чтобы снова и снова находить цены на разные товары. У меня есть таблица с несколькими...