Как выполнить веб-очистку и сохранить или экспортировать данные в файл Excel? - Цифровое Кемерово

Как выполнить веб-очистку и сохранить или экспортировать данные в файл Excel? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как выполнить веб-очистку и сохранить или экспортировать данные в файл Excel?

Цитата

Сообщение Anonymous » 28 окт 2024, 12:18

Это код для получения данных с веб-сайта и экспорта данных в Excel с помощью простого кода Python.
Возможно, вам придется установить необходимые зависимости с помощью команды pip.

запросы на установку pip
pip install bs4
pip install selenium
pip install pandas
pip install openpyxl
pip install xlsxwriter

Любую помощь, необходимую по этому коду, вы можете связаться со мной по электронной почте

Код: Выделить всё

import requests
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
import os
import pandas as pd

url = 'https://en.wikipedia.org/wiki/List_of_largest_companies_in_the_United_States_by_revenue'
page = requests.get(url)
soup = BeautifulSoup(page.text, "html.parser")
table = soup.find_all('table')[0] # You can set index for table 0 or 1 or 2 as in webpage there are total 3 tables & having same classname so far.
#print(soup)

world_titles = table.find_all('th')

word_table_titles = [title.text.strip() for title in world_titles]
#print(word_table_titles)

df = pd.DataFrame(columns = word_table_titles)

collumn_data = table.find_all('tr')

for row in collumn_data[1:]:
row_data = row.find_all('td')
indivisualRowData = [data.text.strip() for data in row_data]
lenght = len(df)
df.loc[lenght] = indivisualRowData
#print(indivisualRowData)

from datetime import datetime
#current_working_directory = os.getcwd()
#print(current_working_directory)
#df.to_xlsx(r'/storage/emulated/0/Python Programming',index = False)
filename = datetime.now().strftime("%Y-%m-%d %H-%M-%S")
with pd.ExcelWriter( filename + ' Output.xlsx') as writer:
df.to_excel(writer, index = False)

Как выполнить веб-очистку и сохранить или экспортировать данные в файл Excel с помощью Python

Подробнее здесь: https://stackoverflow.com/questions/791 ... excel-file

Реклама

1730107098

Anonymous

Это код для получения данных с веб-сайта и экспорта данных в Excel с помощью простого кода Python.
Возможно, вам придется установить необходимые зависимости с помощью команды pip.
[list]
[*]запросы на установку pip
[*]pip install bs4
[*]pip install selenium
[*]pip install pandas
[*]pip install openpyxl
[*]pip install xlsxwriter
[/list]
Любую помощь, необходимую по этому коду, вы можете связаться со мной по электронной почте
[code]import requests
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
import os
import pandas as pd

url = 'https://en.wikipedia.org/wiki/List_of_largest_companies_in_the_United_States_by_revenue'
page = requests.get(url)
soup = BeautifulSoup(page.text, "html.parser")
table = soup.find_all('table')[0] # You can set index for table 0 or 1 or 2 as in webpage there are total 3 tables & having same classname so far.
#print(soup)

world_titles = table.find_all('th')

word_table_titles = [title.text.strip() for title in world_titles]
#print(word_table_titles)

df = pd.DataFrame(columns = word_table_titles)

collumn_data = table.find_all('tr')

for row in collumn_data[1:]:
row_data = row.find_all('td')
indivisualRowData = [data.text.strip() for data in row_data]
lenght = len(df)
df.loc[lenght] = indivisualRowData
#print(indivisualRowData)

from datetime import datetime
#current_working_directory = os.getcwd()
#print(current_working_directory)
#df.to_xlsx(r'/storage/emulated/0/Python Programming',index = False)
filename = datetime.now().strftime("%Y-%m-%d %H-%M-%S")
with pd.ExcelWriter( filename + ' Output.xlsx') as writer:
df.to_excel(writer, index = False)
[/code]
Как выполнить веб-очистку и сохранить или экспортировать данные в файл Excel с помощью Python 

Подробнее здесь: [url]https://stackoverflow.com/questions/79132730/how-to-web-scrape-save-or-export-data-into-excel-file[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как выполнить веб-очистку и сохранить или экспортировать данные в файл Excel с помощью Python

Последнее сообщение Anonymous « 28 окт 2024, 12:15
Добавлено в форуме Python

Anonymous » 28 окт 2024, 12:15 » в форуме Python

Привет, это код для получения данных с веб-сайта и экспорта данных в Excel с помощью простого кода Python.
вам может потребоваться установить необходимые зависимости с помощью команды pip.

запросы на установку pip
pip install bs4
pip install...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
28 окт 2024, 12:15
Как выполнить веб-очистку и сохранить или экспортировать данные в файл Excel? [закрыто]

Последнее сообщение Anonymous « 28 окт 2024, 23:35
Добавлено в форуме Python

Anonymous » 28 окт 2024, 23:35 » в форуме Python

Это код для получения данных с веб-сайта и экспорта данных в Excel с помощью простого кода Python.
Возможно, вам придется установить необходимые зависимости с помощью команды pip.

запросы на установку pip
pip install bs4
pip install selenium...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
28 окт 2024, 23:35
Как нам выполнить очистку базы данных между тестами Junit?

Последнее сообщение Anonymous « 27 май 2024, 08:34
Добавлено в форуме JAVA

Anonymous » 27 май 2024, 08:34 » в форуме JAVA

Ниже приведены некоторые классы, поддерживающие функциональность @TestContainers
package com.changeorama.solidify;

import static org.junit.Assert.assertTrue;

import org.junit.jupiter.api.Test;
....

@Testcontainers
public class AbstractTest {...

0 Ответы

43 Просмотры

Последнее сообщение Anonymous
27 май 2024, 08:34
Как правильно выполнить постоянную очистку истории, не влияя на корректность CloudKit?

Последнее сообщение Anonymous « 21 сен 2024, 12:56
Добавлено в форуме IOS

Anonymous » 21 сен 2024, 12:56 » в форуме IOS

В настоящее время мы используем локальные CoreData с функцией CloudKit, используя NSPersistentCloudKitContainer.
Почему мы включаем функцию постоянного отслеживания истории?
Из-за проблемы, описанной в нам необходимо включить...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
21 сен 2024, 12:56
Как выполнить очистку базовой среды Conda? (а не очистка conda для неиспользованных пакетов)

Последнее сообщение Anonymous « 29 окт 2024, 13:51
Добавлено в форуме Python

Anonymous » 29 окт 2024, 13:51 » в форуме Python

Недавно я боролся с проблемой удаления множества библиотек, таких как pandas,plotly и т. д., которые я случайно установил в базовой среде (я устанавливал их в свой блокнот Jupyter и не понимал, какая среда Я использовал).
Есть также несколько...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
29 окт 2024, 13:51

Вернуться в «Python»

Programmiererforum