Извлечь таблицу со страницы Markdown в структуру данных Python

Извлечь таблицу со страницы Markdown в структуру данных Python ⇐ Html

1 сообщение • Страница 1 из 1

Anonymous

Извлечь таблицу со страницы Markdown в структуру данных Python

Цитата

Сообщение Anonymous » 21 июл 2025, 22:26

Я хотел извлечь таблицу со страницы Github Markdown в структуру данных Python, предпочтительно в Pandas Dataframe, но словарь или что -либо еще в принципе также в принципе. Поэтому я подумал, что начну с requests.get () , а затем использовать пакет Markdown для получения таблиц. Но это, по-видимому, не конец истории. < /P>
Это то, что у меня есть до сих пор: < /p>

Код: Выделить всё

import markdown
import requests

url = "https://github.com/alfkoehn/fusion_plots/blob/master/fusion_companies/fusion_companies.md"

response = requests.get(url)
html = markdown.markdown(response.content)

Я думаю, следующим будет BS4.beautifulsoup (html, 'html.parser') , но это не очень полезно. Как извлечь, в этом случае два, таблицы с веб -страницы Markdown?

Подробнее здесь: https://stackoverflow.com/questions/797 ... -structure

1753125992

Anonymous

 Я хотел извлечь таблицу со страницы Github Markdown в структуру данных Python, предпочтительно в Pandas Dataframe, но словарь или  что -либо еще  в принципе также в принципе. Поэтому я подумал, что начну с requests.get () , а затем использовать пакет Markdown  для получения таблиц. Но это, по-видимому, не конец истории. < /P>
Это то, что у меня есть до сих пор: < /p>
[code]import markdown
import requests

url = "https://github.com/alfkoehn/fusion_plots/blob/master/fusion_companies/fusion_companies.md"

response = requests.get(url)
html = markdown.markdown(response.content)
[/code]
Я думаю, следующим будет BS4.beautifulsoup (html, 'html.parser') , но это не очень полезно. Как извлечь, в этом случае два, таблицы с веб -страницы Markdown? 
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79709106/extract-table-from-github-markdown-page-into-python-data-structure[/url]