Использование красивого супа (или, может быть, какой -то другой библиотеки) для очистки данных с веб -страницы .aspx, соPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Использование красивого супа (или, может быть, какой -то другой библиотеки) для очистки данных с веб -страницы .aspx, со

Сообщение Anonymous »

Мне было интересно, сможет ли кто -нибудь помочь мне с проблемой по соскобке в Интернете .. Я новичок в питоне и в Интернете. />"https://www.cocorahs.org/viewdata/listd ... x"образное. Программа работает отлично для веб -страницы без флажок. Однако на веб -странице, на которой я пытаюсь соскрести данные, имеет некоторые флажки, и я думаю, что это именно та часть, с которой я прижимаю ..
Я сделал источник страницы просмотра, и я посмотрел имена тегов HTML, но я чувствую
, я не хватает чего -то, что я думаю, что я удивляюсь, что я удивляюсь. /> Две строки после линии FL-BV-163-это те, о которых меня беспокоит .. < /strong> < /p>
Ниже приведен код. Какие изменения я должен внести/добавить к этому? Должен ли я использовать больше библиотек? Спасибо !! < /p>
import requests
from bs4 import BeautifulSoup
from requests_html import HTMLSession

import pandas as pd
from io import StringIO

from datetime import datetime

session = requests.Session()

response = session.get('https://www.cocorahs.org/ViewData/ListD ... ports.aspx')

soup = BeautifulSoup(response.content, "html.parser")
view_state = soup.find("input", {"name": "__VIEWSTATE", "value": True})["value"]
view_state_generator = soup.find("input", {"name": "__VIEWSTATEGENERATOR", "value": True})["value"]
event_validation = soup.find("input", {"name": "__EVENTVALIDATION", "value": True})["value"]

response = session.post('https://www.cocorahs.org/ViewData/ListD ... ports.aspx', data={
"__EVENTTARGET": "",
"__EVENTARGUMENT": "",
"__LASTFOCUS": "",
"VAM_Group": "",
"__VIEWSTATE": view_state,
"VAM_JSE": "1",
"__VIEWSTATEGENERATOR": view_state_generator,
"__EVENTVALIDATION": event_validation,
"obsSwitcher:ddlObsUnits": "usunits",
"frmPrecipReportSearch:ucStationTextFieldsFilter:tbTextFieldValue": "FL-BV-163",
"frmPrecipReportSearch:ucStationTextFieldsFilter:cblTextFieldsToSearch:0": "checked",
"frmPrecipReportSearch:ucStationTextFieldsFilter:cblTextFieldsToSearch:1": "",
"frmPrecipReportSearch:ucStateCountyFilter:ddlCountry": "allcountries",
"frmPrecipReportSearch:ucDateRangeFilter:dcStartDate:di": "6/13/2025",
"frmPrecipReportSearch:ucDateRangeFilter:dcStartDate:hfDate": "2025-06-13",
"frmPrecipReportSearch:ucDateRangeFilter:dcEndDate:di": "6/16/2025",
"frmPrecipReportSearch:ucDateRangeFilter:dcEndDate:hfDate": "2025-06-16",
"frmPrecipReportSearch:ddlPrecipField": "GaugeCatch",
"frmPrecipReportSearch:ucPrecipValueFilter:ddlOperator": "LessEqual",
"frmPrecipReportSearch:ucPrecipValueFilter:tbPrecipValue:tbPrecip": "0.15",
"frmPrecipReportSearch:btnSearch": "Search",
})

table = BeautifulSoup(response.content, "html.parser").find("table", id="ucReportList_ReportGrid")

if table is None:
raise RuntimeError("table#ucReportList_ReportGrid not found")

df = pd.read_html(StringIO(str(table)))[0]

print(df)


Подробнее здесь: https://stackoverflow.com/questions/796 ... om-an-aspx
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»