Программа чтения PDF-викторин с использованием скрипта PythonPython

Программы на Python
Ответить
Anonymous
 Программа чтения PDF-викторин с использованием скрипта Python

Сообщение Anonymous »

Я пытаюсь понять, какую логику использовать, чтобы прочитать эту анкету в формате PDF. (вставка)
Идея состоит в том, что ответы на этот опросник сохраняются в Excel. Следуя этому стилю. (вставьте Excel)
Я пытаюсь сначала прочитать PDF-файл в текстовом формате, чтобы получить представление о том, как реализовать логику, но я не знаю, как это реализовать, поскольку это очень запутанно. это в формате Excel.
Файл PDF на github:
https://github.com/Gianlo478/PDF.git
Это мой код, который я использую для чтения это в txt, но я не знаю точно, как использовать эту логику, чтобы она корректно работала в нескольких PDF-файлах одного и того же стиля.

Код: Выделить всё

 import pdfplumber

pdf_path = r"C:\\Users\\User\\Desktop\\Input\\Preguntas_respuestas.pdf"

output_txt = r"C:\\Users\\User\\Desktop\\Output\\respuesta.txt"

def format_table(rows):
formatted = []
for row in rows:
if any(row):
formatted.append("//".join(cell.strip() if cell else "" for cell in row))
return "\n".join(formatted)

with pdfplumber.open(pdf_path) as pdf, open(output_txt, "w", encoding="utf-8") as output_file:
for page_number, page in enumerate(pdf.pages, start=1):
tables = page.extract_tables()
if tables:
for table_index, table in enumerate(tables, start=1):
output_file.write(f"Página {page_number}, Tabla {table_index}:\n")
output_file.write(format_table(table))
output_file.write("\n\n")
print(f"Tablas extraídas y guardadas en '{output_txt}'")
Изображение

Изображение

Цель состоит в том, чтобы в PDF-файле записывались данные, отмеченные знаком «X», равным 1, если поле слева отмечено (ДА) и 0 для поля справа (НЕТ), в случае третьего вопроса это 2, если отмечено третье поле.
Если у него только 1 поле ответа, например вопросы ниже, это 1, если вы отметьте X и 0, если ничего не проверяете.
Как именно будет работать логика этого типа сценария или насколько это возможно?

Подробнее здесь: https://stackoverflow.com/questions/792 ... hon-script
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»