Объединение файлов HTML с Python [закрыто]Html

Программисты Html
Ответить
Anonymous
 Объединение файлов HTML с Python [закрыто]

Сообщение Anonymous »

import os
from bs4 import BeautifulSoup

output_doc = BeautifulSoup()
output_doc.append(output_doc.new_tag("html"))
output_doc.html.append(output_doc.new_tag("body"))

for file in os.listdir(data_folder):
if not file.lower().endswith('.html'):
continue

with open(file, 'r') as html_file:
output_doc.body.extend(BeautifulSoup(html_file.read(), "html.parser").body)

print(output_doc.prettify())
< /code>
У меня есть 5 различных HTML -файлов (File1, File2, File3, File4 и File5), которые я хочу объединить в один файл. Я применил код выше, чтобы объединить файлы. Код работает хорошо, однако, комбинированный HTML -вывод имеет контент File1, повторяющуюся 5 раз перед добавлением файла 2 содержимого (которое также повторялось 5 раз), прежде чем добавлять файл 3 содержимого и т. Д. То, что я ожидал, является лишь одним файлом с 5 выводом, а не 25. Я также заметил, что HTML имеет сценарий Java в нем, когда я осматриваю файлы. src = "https://i.sstatic.net/pbcbwxvf.png"/>

Подробнее здесь: https://stackoverflow.com/questions/795 ... ith-python
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Html»