Я хотел извлечь таблицу со страницы Github Markdown в структуру данных Python, предпочтительно в Pandas Dataframe, но словарь или что -либо еще в принципе также в принципе. Поэтому я подумал, что начну с requests.get () , а затем использовать пакет Markdown для получения таблиц. Но это, по-видимому, не конец истории. < /P>
Это то, что у меня есть до сих пор: < /p>
Код: Выделить всё
import markdown
import requests
url = "https://github.com/alfkoehn/fusion_plots/blob/master/fusion_companies/fusion_companies.md"
response = requests.get(url)
html = markdown.markdown(response.content)
Я думаю, следующим будет BS4.beautifulsoup (html, 'html.parser') , но это не очень полезно. Как извлечь, в этом случае два, таблицы с веб -страницы Markdown?
Подробнее здесь:
https://stackoverflow.com/questions/797 ... -structure