Объединение файлов HTML с PythonHtml

Программисты Html
Ответить
Anonymous
 Объединение файлов HTML с Python

Сообщение Anonymous »

import os
from bs4 import BeautifulSoup

output_doc = BeautifulSoup()
output_doc.append(output_doc.new_tag("html"))
output_doc.html.append(output_doc.new_tag("body"))

for file in os.listdir(data_folder):
if not file.lower().endswith('.html'):
continue

with open(file, 'r') as html_file:
output_doc.body.extend(BeautifulSoup(html_file.read(), "html.parser").body)

print(output_doc.prettify())
< /code>
У меня есть 5 различных HTML -файлов (File1, File2, File3, File4 и File5), которые я хочу объединить в один файл. После слияния, используя приведенный выше код, комбинированный HTML -вывод имеет повторение содержимого File1 5 раз перед добавлением файла 2 содержимого (которое также повторялось 5 раз), перед добавлением файла 3 содержимого и т. Д. То, что я ожидал, является лишь одним файлом с 5 выводом, а не 25


Подробнее здесь: https://stackoverflow.com/questions/795 ... ith-python
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Html»