Выберите «год» в строке из вывода Beautiful Soup. ⇐ Python
Выберите «год» в строке из вывода Beautiful Soup.
Я создаю веб-скребок для сбора данных об автомобилях. Используя Beautiful Soup, я собрал данные с carsdirect.com. Я хочу фильтровать только автомобили модели "Highlander 2011 года выпуска". Это мой первый проект, пожалуйста, будьте нежны и ELI5.
запросы на импорт из bs4 импорт BeautifulSoup URL = "https://www.carsdirect.com/used_cars/listings/toyota" страница = Requests.get(url) суп = BeautifulSoup(page.content, "html.parser") результаты = суп.find(id="mainWrapper") job_elements = results.find_all("div", class_="infoCell") для job_element в job_elements: print(job_element, end="\n"*2) для job_element в job_elements: model_element = job_element.find("p", class_="ymmListRowTitle") ymm_element = job_element.find("p", class_="ymmListRowTrim") миль_элемент = job_element.find("div", class_="mileLine") Price_element = job_element.find("div", class_="priceLine") contact_element = job_element.find("div", class_="contactBlock") print(model_element.text.strip(),ymm_element.text.strip()) печать(miles_element.text.strip()) печать(contact_element.text.strip()) Распечатать() #scraped_cars = results.find_all("div", string=lambda text: "highlander" в text.lower()) Выход:
Тойота Королла ЛЕ 2022 года 47 087 миль Кэл Авто Нет (3 мили)
Тойота Приус c Two 2018 года 73 386 миль Кэл Авто Нет (3 мили)
Тойота Камри SE 2018 года 79 547 миль Кэл Авто Нет (3 мили)
Я создаю веб-скребок для сбора данных об автомобилях. Используя Beautiful Soup, я собрал данные с carsdirect.com. Я хочу фильтровать только автомобили модели "Highlander 2011 года выпуска". Это мой первый проект, пожалуйста, будьте нежны и ELI5.
запросы на импорт из bs4 импорт BeautifulSoup URL = "https://www.carsdirect.com/used_cars/listings/toyota" страница = Requests.get(url) суп = BeautifulSoup(page.content, "html.parser") результаты = суп.find(id="mainWrapper") job_elements = results.find_all("div", class_="infoCell") для job_element в job_elements: print(job_element, end="\n"*2) для job_element в job_elements: model_element = job_element.find("p", class_="ymmListRowTitle") ymm_element = job_element.find("p", class_="ymmListRowTrim") миль_элемент = job_element.find("div", class_="mileLine") Price_element = job_element.find("div", class_="priceLine") contact_element = job_element.find("div", class_="contactBlock") print(model_element.text.strip(),ymm_element.text.strip()) печать(miles_element.text.strip()) печать(contact_element.text.strip()) Распечатать() #scraped_cars = results.find_all("div", string=lambda text: "highlander" в text.lower()) Выход:
Тойота Королла ЛЕ 2022 года 47 087 миль Кэл Авто Нет (3 мили)
Тойота Приус c Two 2018 года 73 386 миль Кэл Авто Нет (3 мили)
Тойота Камри SE 2018 года 79 547 миль Кэл Авто Нет (3 мили)
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как извлечь только первые элементы из нескольких тегов диапазона с помощью Beautiful Soup?
Anonymous » » в форуме Python - 0 Ответы
- 42 Просмотры
-
Последнее сообщение Anonymous
-
-
-
При анализе HTML с помощью Beautiful Soup иногда отсутствуют дочерние теги.
Anonymous » » в форуме CSS - 0 Ответы
- 25 Просмотры
-
Последнее сообщение Anonymous
-
-
-
При анализе HTML с помощью Beautiful Soup иногда отсутствуют дочерние теги.
Anonymous » » в форуме CSS - 0 Ответы
- 24 Просмотры
-
Последнее сообщение Anonymous
-