Идея состоит в том, что ответы на этот опросник сохраняются в Excel. Следуя этому стилю. (вставьте Excel)
Я пытаюсь сначала прочитать PDF-файл в текстовом формате, чтобы получить представление о том, как реализовать логику, но я не знаю, как это реализовать, поскольку это очень запутанно. это в формате Excel.
Файл PDF на github:
https://github.com/Gianlo478/PDF.git
Это мой код, который я использую для чтения это в txt, но я не знаю точно, как использовать эту логику, чтобы она корректно работала в нескольких PDF-файлах одного и того же стиля.
Код: Выделить всё
import pdfplumber
pdf_path = r"C:\\Users\\User\\Desktop\\Input\\Preguntas_respuestas.pdf"
output_txt = r"C:\\Users\\User\\Desktop\\Output\\respuesta.txt"
def format_table(rows):
formatted = []
for row in rows:
if any(row):
formatted.append("//".join(cell.strip() if cell else "" for cell in row))
return "\n".join(formatted)
with pdfplumber.open(pdf_path) as pdf, open(output_txt, "w", encoding="utf-8") as output_file:
for page_number, page in enumerate(pdf.pages, start=1):
tables = page.extract_tables()
if tables:
for table_index, table in enumerate(tables, start=1):
output_file.write(f"Página {page_number}, Tabla {table_index}:\n")
output_file.write(format_table(table))
output_file.write("\n\n")
print(f"Tablas extraídas y guardadas en '{output_txt}'")


Цель состоит в том, чтобы в PDF-файле записывались данные, отмеченные знаком «X», равным 1, если поле слева отмечено (ДА) и 0 для поля справа (НЕТ), в случае третьего вопроса это 2, если отмечено третье поле.
Если у него только 1 поле ответа, например вопросы ниже, это 1, если вы отметьте X и 0, если ничего не проверяете.
Как именно будет работать логика этого типа сценария или насколько это возможно?
Подробнее здесь: https://stackoverflow.com/questions/792 ... hon-script
Мобильная версия