Очистка страницы каннабиса, неудобный макетHtml

Программисты Html
Ответить
Anonymous
 Очистка страницы каннабиса, неудобный макет

Сообщение Anonymous »

Страница, которую я пытаюсь очистить: https://agco.maps.arcgis.com/apps/webap ... 3f1de8d370. С этой страницы я пытаюсь получить 5 типов данных: название диспансера, адрес, почтовый индекс (например, N4K 5N6), статус и дату публичного уведомления.
Моя проблема в том, что я понятия не имею, как подойти к этой странице. Я знаю, что нужные мне данные находятся в разделе «_description», но понятия не имею, что такое элемент таблицы и класс. Когда я просматриваю страницу, я вижу эти неуклюжие секции прямоугольников, и это заставляет меня задуматься, не выделена ли эта точка отдельно? или элемент таблицы и заголовки просто упакованы далеко вверх, и поэтому я их не нахожу? Любая идея о том, как я могу подойти к этой странице, была бы замечательной.
from bs4 import BeautifulSoup
import requests
import pandas as pd

url = https://agco.maps.arcgis.com/apps/webap ... 3f1de8d370

r = requests.get(url)

soup = BeautifulSoup(r.text, 'html.parser')

cannabis = soup.find( Would put the header here)



Подробнее здесь: https://stackoverflow.com/questions/685 ... ard-layout
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Html»