Pandas и очистка HTML-кода bs4Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Pandas и очистка HTML-кода bs4

Сообщение Anonymous »

Я извлекаю данные из html-файла, они имеют формат таблицы, поэтому я создал эту строку кода для преобразования всех таблиц во фрейм данных с помощью pandas.

Код: Выделить всё

dfs = pd.read_html("synced_contacts.html")
Теперь печатаем вторую строку таблицы фрейма данных Вывод следующий:
[img]https://i.sstatic.net /HRqLj.png[/img]

Как сделать, чтобы информация не дублировалась в две колонки, как показано на изображении, а также отдельно "ИмяДаниела" в "Имя" в качестве первого столбца и «Даниэла» в качестве значения.
Ожидаемый результат:
Изображение

Структура HTML таблицы:

Код: Выделить всё

Synced contacts 
[img]files/Instagram-Logo.png[/img]
 Synced contactsContacts you've syncedFirst NameDanielaLast NameGuevaraContact Information3017004914First NameMariannaContact Information3125761972First NameAna MariaLast NameGarzonContact Information3214948507



Подробнее здесь: https://stackoverflow.com/questions/745 ... l-scraping
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»