Парсинг веб-страниц с помощью Python BeautifulSoup в Spyder IDE

Парсинг веб-страниц с помощью Python BeautifulSoup в Spyder IDE ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Парсинг веб-страниц с помощью Python BeautifulSoup в Spyder IDE

Цитата

Сообщение Anonymous » 21 окт 2024, 14:54

Я пытаюсь очистить таблицу по следующему URL-адресу в Spyder IDE. Ниже приведен мой код. Я проверил код hteml, чтобы определить класс таблицы и все теги th, tr, td,. Но извлечение заголовков и данных строк не работает. Он объединяет строки, поэтому первая запись — это строка 1 + все строки, строка 2 + все строки. Я не знаю, как разделить строки. Просмотр html-тегов не помогает. Я новичок в программировании, и мне нужны все рекомендации. Также необходимо сохранить это в CSV-файл.
url = 'https://www.aoml.noaa.gov/hrd/hurdat/In ... canes.html'
Я ожидаю, что данные в таблице на веб-сайте будут в формате CSV.
```
import os
print(os.getcwd())

import pandas as pd
import requests
from bs4 import BeautifulSoup
import csv

url = 'https://www.aoml.noaa.gov/hrd/hurdat/In ... canes.html'
response = requests.get(url)
html_content = response.text
soup = BeautifulSoup(html_content, 'html.parser')

table = soup.find('table', {'class': 'content'})
data = table.find_all('tr')

headers = []
for header in data[2].find_all('td'):
header_lines = header.text.strip().split('\r\n')

print(headers)

data = []
for row in rows.find_all('tr')[3:]:`find data after 3rd row`
cols = row.find_all('td')
cols = [col.get_text(strip=True) for col in cols]
if cols:
data.append(cols)

```

Подробнее здесь: https://stackoverflow.com/questions/791 ... spyder-ide

1729511659

Anonymous

Я пытаюсь очистить таблицу по следующему URL-адресу в Spyder IDE. Ниже приведен мой код.  Я проверил код hteml, чтобы определить класс таблицы и все теги th, tr, td,. Но извлечение заголовков и данных строк не работает. Он объединяет строки, поэтому первая запись — это строка 1 + все строки, строка 2 + все строки. Я не знаю, как разделить строки. Просмотр html-тегов не помогает. Я новичок в программировании, и мне нужны все рекомендации. Также необходимо сохранить это в CSV-файл.
url = 'https://www.aoml.noaa.gov/hrd/hurdat/International_Hurricanes.html'
Я ожидаю, что данные в таблице на веб-сайте будут в формате CSV.
```
import os
print(os.getcwd())

import pandas as pd
import requests
from bs4 import BeautifulSoup
import csv

url = 'https://www.aoml.noaa.gov/hrd/hurdat/International_Hurricanes.html'
response = requests.get(url)
html_content = response.text
soup = BeautifulSoup(html_content, 'html.parser')

table = soup.find('table', {'class': 'content'})
data = table.find_all('tr')

headers = []
for header in data[2].find_all('td'):
header_lines = header.text.strip().split('\r\n')

print(headers)

data = []
for row in rows.find_all('tr')[3:]:`find data after 3rd row`
cols = row.find_all('td')
cols = [col.get_text(strip=True) for col in cols]
if cols:
data.append(cols)

```
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79107617/web-scraping-with-python-beautifulsoup-in-spyder-ide[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Парсинг веб-страниц / Парсинг веб-страниц Zomato с помощью BeautifulSoup

Последнее сообщение Anonymous « 21 янв 2025, 09:50
Добавлено в форуме Python

Anonymous » 21 янв 2025, 09:50 » в форуме Python

Я попробовал парсинг веб-страниц со ссылкой на
Просто скопировал и вставил код на сайт, но получаю ошибку на втором шаге.
import requests
from bs4 import BeautifulSoup

#Used headers/agent because the request was timed out and asking for an agent....

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
21 янв 2025, 09:50
Парсинг веб-страниц с помощью Python BeautifulSoup в Spyder IDE

Последнее сообщение Anonymous « 20 окт 2024, 20:11
Добавлено в форуме Python

Anonymous » 20 окт 2024, 20:11 » в форуме Python

Я пытаюсь очистить таблицу по следующему URL-адресу в Spyder IDE. Ниже приведен мой код. Я проверил код hteml, чтобы определить класс таблицы и все теги th, tr, td,. Но извлечение заголовков и данных строк не работает. Он объединяет строки, поэтому...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
20 окт 2024, 20:11
Парсинг веб-страниц с помощью Python BeautifulSoup в Spyder IDE

Последнее сообщение Anonymous « 20 окт 2024, 20:56
Добавлено в форуме Python

Anonymous » 20 окт 2024, 20:56 » в форуме Python

Я пытаюсь очистить таблицу по следующему URL-адресу в Spyder IDE. Ниже приведен мой код. Я проверил код hteml, чтобы определить класс таблицы и все теги th, tr, td,. Но извлечение заголовков и данных строк не работает. Он объединяет строки, поэтому...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
20 окт 2024, 20:56
Парсинг веб-страниц с помощью Python BeautifulSoup в Spyder IDE

Последнее сообщение Anonymous « 20 окт 2024, 22:47
Добавлено в форуме Python

Anonymous » 20 окт 2024, 22:47 » в форуме Python

Я пытаюсь очистить таблицу по следующему URL-адресу в Spyder IDE. Ниже приведен мой код. Я проверил код hteml, чтобы определить класс таблицы и все теги th, tr, td,. Но извлечение заголовков и данных строк не работает. Он объединяет строки, поэтому...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
20 окт 2024, 22:47
Парсинг веб-страниц с помощью Python BeautifulSoup в Spyder IDE

Последнее сообщение Anonymous « 21 окт 2024, 16:00
Добавлено в форуме Python

Anonymous » 21 окт 2024, 16:00 » в форуме Python

Я пытаюсь очистить таблицу по следующему URL-адресу в Spyder IDE. Ниже приведен мой код. Я проверил код hteml, чтобы определить класс таблицы и все теги th, tr, td,. Но извлечение заголовков и данных строк не работает. Он объединяет строки, поэтому...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
21 окт 2024, 16:00

Вернуться в «Python»