Мне было интересно, сможет ли кто -нибудь помочь мне с проблемой по соскобке в Интернете .. Я новичок в питоне и в Интернете. />"https://www.cocorahs.org/viewdata/listd ... x"образное. Программа работает отлично для веб -страницы без флажок. Однако на веб -странице, на которой я пытаюсь соскрести данные, имеет некоторые флажки, и я думаю, что это именно та часть, с которой я прижимаю ..
Я сделал источник страницы просмотра, и я посмотрел имена тегов HTML, но я чувствую
, я не хватает чего -то, что я думаю, что я удивляюсь, что я удивляюсь. /> Две строки после линии FL-BV-163-это те, о которых меня беспокоит .. < /strong> < /p>
Ниже приведен код. Какие изменения я должен внести/добавить к этому? Должен ли я использовать больше библиотек? Спасибо !! < /p>
import requests
from bs4 import BeautifulSoup
from requests_html import HTMLSession
import pandas as pd
from io import StringIO
from datetime import datetime
session = requests.Session()
response = session.get('https://www.cocorahs.org/ViewData/ListD ... ports.aspx')
soup = BeautifulSoup(response.content, "html.parser")
view_state = soup.find("input", {"name": "__VIEWSTATE", "value": True})["value"]
view_state_generator = soup.find("input", {"name": "__VIEWSTATEGENERATOR", "value": True})["value"]
event_validation = soup.find("input", {"name": "__EVENTVALIDATION", "value": True})["value"]
response = session.post('https://www.cocorahs.org/ViewData/ListD ... ports.aspx', data={
"__EVENTTARGET": "",
"__EVENTARGUMENT": "",
"__LASTFOCUS": "",
"VAM_Group": "",
"__VIEWSTATE": view_state,
"VAM_JSE": "1",
"__VIEWSTATEGENERATOR": view_state_generator,
"__EVENTVALIDATION": event_validation,
"obsSwitcher:ddlObsUnits": "usunits",
"frmPrecipReportSearch:ucStationTextFieldsFilter:tbTextFieldValue": "FL-BV-163",
"frmPrecipReportSearch:ucStationTextFieldsFilter:cblTextFieldsToSearch:0": "checked",
"frmPrecipReportSearch:ucStationTextFieldsFilter:cblTextFieldsToSearch:1": "",
"frmPrecipReportSearch:ucStateCountyFilter:ddlCountry": "allcountries",
"frmPrecipReportSearch:ucDateRangeFilter:dcStartDate:di": "6/13/2025",
"frmPrecipReportSearch:ucDateRangeFilter:dcStartDate:hfDate": "2025-06-13",
"frmPrecipReportSearch:ucDateRangeFilter:dcEndDate:di": "6/16/2025",
"frmPrecipReportSearch:ucDateRangeFilter:dcEndDate:hfDate": "2025-06-16",
"frmPrecipReportSearch:ddlPrecipField": "GaugeCatch",
"frmPrecipReportSearch:ucPrecipValueFilter:ddlOperator": "LessEqual",
"frmPrecipReportSearch:ucPrecipValueFilter:tbPrecipValue:tbPrecip": "0.15",
"frmPrecipReportSearch:btnSearch": "Search",
})
table = BeautifulSoup(response.content, "html.parser").find("table", id="ucReportList_ReportGrid")
if table is None:
raise RuntimeError("table#ucReportList_ReportGrid not found")
df = pd.read_html(StringIO(str(table)))[0]
print(df)
Подробнее здесь: https://stackoverflow.com/questions/796 ... om-an-aspx
Использование красивого супа (или, может быть, какой -то другой библиотеки) для очистки данных с веб -страницы .aspx, со ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Проблема с очисткой веб-страниц с использованием селена и красивого супа
Anonymous » » в форуме Python - 0 Ответы
- 63 Просмотры
-
Последнее сообщение Anonymous
-