Веб-скребок не получает полные данные с веб-сайтаPython

Программы на Python
Ответить
Anonymous
 Веб-скребок не получает полные данные с веб-сайта

Сообщение Anonymous »

Я пытаюсь очистить этот сайт, чтобы подготовить базу данных для лагерей сдачи крови, используя Python.

Во-первых, при попытке получить исходный код html веб-сайта из запросов или urllib возникает ошибка SSL:certificate_verify_error, которую я обошел, установив параметр проверки как False для Requests.get() или создав непроверенный контекст для urllib (быстрое исправление), это позволяет мне обойти ошибку, но когда я вижу полученный исходный html-код, содержимое таблицы, которое мне нужно, пусто, в исходном коде веб-сайта они включены в теги tbody, но моя команда request.get() возвращает мне только эти теги, а не содержимое между ними. Я новичок в парсинге, буду благодарен за небольшое руководство. ты

from urllib.request import urlopen as uReq
import ssl
from bs4 import BeautifulSoup as soup

my_url = 'https://www.eraktkosh.in/BLDAHIMS/blood ... hedule.cnt'
sp_context = ssl._create_unverified_context()
uClient = uReq(my_url,context=sp_context)
page_html = uClient.read()
uClient.close()
page_soup=soup(page_html,"html.parser")
table = page_soup.find('tbody')
print (table) #this outputs ""
trow = table.find('tr')
print (trow) #this outputs "None"



Первая команда печати выдает





и вторые результаты

None


Подробнее здесь: https://stackoverflow.com/questions/565 ... -a-website
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»