Обновите код Python — в библиотеке PyPDF2 есть устаревшие объекты, используемые в коде Python.

Обновите код Python — в библиотеке PyPDF2 есть устаревшие объекты, используемые в коде Python. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Обновите код Python — в библиотеке PyPDF2 есть устаревшие объекты, используемые в коде Python.

Цитата

Сообщение Anonymous » 24 янв 2025, 07:59

Я смог использовать код Python в ОС на основе Linux, но когда я попытался запустить его тот же код в ОС на основе Windows, у меня появились сообщения об отсеках. < /p>
Мой вопрос: , как можно обновить код, чтобы преодолеть проблемы снижения? >
< /ol>

Код: Выделить всё

import PyPDF2
import openpyxl

def pdf_to_text(pdf_file):
text = ""
with open(pdf_file, "rb") as file:
pdf_reader = PyPDF2.PdfFileReader(file)
for page_num in range(pdf_reader.getNumPages()):
page = pdf_reader.getPage(page_num)
text += page.extractText()
return text

def save_text_to_excel(text, excel_file):
workbook = openpyxl.Workbook()
sheet = workbook.active
lines = text.split("\n")
for row_num, line in enumerate(lines, 1):
sheet.cell(row=row_num, column=1, value=line)
workbook.save(excel_file)

if __name__ == "__main__":
pdf_file = "PDF_File_name.pdf"
excel_file = "output.xlsx"

pdf_text = pdf_to_text(pdf_file)
save_text_to_excel(pdf_text, excel_file)

output: " pypdf2.errors.deprecationError: pdffilereader устарел и был удален в PYPDF2 3.0.0. Вместо этого PDFreader. "< /p>

Поэтому я обновил этот код Python: < /li>
< /ol>

Код: Выделить всё

import PyPDF2
import openpyxl

def pdf_to_text(pdf_file):
text = ""
with open(pdf_file, "rb") as file:
pdf_reader = PyPDF2.PdfReader(file)
for page_num in range(pdf_reader.getNumPages()):
page = pdf_reader.getPage(page_num)
text += page.extractText()
return text

def save_text_to_excel(text, excel_file):
workbook = openpyxl.Workbook()
sheet = workbook.active
lines = text.split("\n")
for row_num, line in enumerate(lines, 1):
sheet.cell(row=row_num, column=1, value=line)
workbook.save(excel_file)

if __name__ == "__main__":
pdf_file = "PDF_File_name.pdf"
excel_file = "output.xlsx"

pdf_text = pdf_to_text(pdf_file)
save_text_to_excel(pdf_text, excel_file)

output: " pypdf2.errors.deprecationError: reader.getNumpages снижается и удаляется в PYPDF2 3.0.0. Используйте len (reader.pages ) вместо. en/andal/user/migration-1-to -2.html, который утверждает, для обновления:

reader.getnumpages ()/reader.numpages ➔ len (reader.pages) < /p>

Код: Выделить всё

import PyPDF2
import openpyxl

def pdf_to_text(pdf_file):
text = ""
with open(pdf_file, "rb") as file:
pdf_reader = PyPDF2.PdfReader(file)
for page_num in range(pdf_reader.len(reader.pages)):
page = pdf_reader.getPage(page_num)
text += page.extractText()
return text

def save_text_to_excel(text, excel_file):
workbook = openpyxl.Workbook()
sheet = workbook.active
lines = text.split("\n")
for row_num, line in enumerate(lines, 1):
sheet.cell(row=row_num, column=1, value=line)
workbook.save(excel_file)

if __name__ == "__main__":
pdf_file = "PDF_File_name.pdf"
excel_file = "output.xlsx"

pdf_text = pdf_to_text(pdf_file)
save_text_to_excel(pdf_text, excel_file)

output: " attributeerror: 'pdfreader' объект не имеет атрибута 'len' "
< ol start = "4">
Я обновил код на основе комментариев Abdul Aziz Barkat ':
typo: pdf_reader.len (reader.pages) Сравните с Len (reader.pages ), как указано в сообщении об исчезновении ... вы должны написать LEN (pdf_reader.pages), Len - это встроенная функция в Python. < /li>
< /ol>

Код: Выделить всё

import PyPDF2
import openpyxl

def pdf_to_text(pdf_file):
text = ""
with open(pdf_file, "rb") as file:
pdf_reader = PyPDF2.PdfReader(file)
for page_num in range(len(pdf_reader.pages)):
page = pdf_reader.getPage(page_num)
text += page.extractText()
return text

def save_text_to_excel(text, excel_file):
workbook = openpyxl.Workbook()
sheet = workbook.active
lines = text.split("\n")
for row_num, line in enumerate(lines, 1):
sheet.cell(row=row_num, column=1, value=line)
workbook.save(excel_file)

if __name__ == "__main__":
pdf_file = "computers.pdf"
excel_file = "output.xlsx"

pdf_text = pdf_to_text(pdf_file)
save_text_to_excel(pdf_text, excel_file)

Вывод: "PyPDF2.errors.DeprecationError: reader.getPage(pageNumber) устарел и был удален в PyPDF2 3.0.0. Используйте Reader. вместо этого страницы[page_number]."

Подробнее здесь: https://stackoverflow.com/questions/769 ... -python-co

1737694772

Anonymous

 Я смог использовать код Python в ОС на основе Linux, но когда я попытался запустить его тот же код в ОС на основе Windows, у меня появились сообщения об отсеках. < /p>
[b] Мой вопрос: [/b], как можно обновить код, чтобы преодолеть проблемы снижения? >
< /ol>
[code]import PyPDF2
import openpyxl

def pdf_to_text(pdf_file):
text = ""
with open(pdf_file, "rb") as file:
pdf_reader = PyPDF2.PdfFileReader(file)
for page_num in range(pdf_reader.getNumPages()):
page = pdf_reader.getPage(page_num)
text += page.extractText()
return text

def save_text_to_excel(text, excel_file):
workbook = openpyxl.Workbook()
sheet = workbook.active
lines = text.split("\n")
for row_num, line in enumerate(lines, 1):
sheet.cell(row=row_num, column=1, value=line)
workbook.save(excel_file)

if __name__ == "__main__":
pdf_file = "PDF_File_name.pdf"
excel_file = "output.xlsx"

pdf_text = pdf_to_text(pdf_file)
save_text_to_excel(pdf_text, excel_file)
[/code]
[b] output: [/b] " pypdf2.errors.deprecationError: pdffilereader устарел и был удален в PYPDF2 3.0.0. Вместо этого PDFreader.  "< /p>
[list]
[*] Поэтому я обновил этот код Python: < /li>
< /ol>
[code]import PyPDF2
import openpyxl

def pdf_to_text(pdf_file):
text = ""
with open(pdf_file, "rb") as file:
pdf_reader = PyPDF2.PdfReader(file)
for page_num in range(pdf_reader.getNumPages()):
page = pdf_reader.getPage(page_num)
text += page.extractText()
return text

def save_text_to_excel(text, excel_file):
workbook = openpyxl.Workbook()
sheet = workbook.active
lines = text.split("\n")
for row_num, line in enumerate(lines, 1):
sheet.cell(row=row_num, column=1, value=line)
workbook.save(excel_file)

if __name__ == "__main__":
pdf_file = "PDF_File_name.pdf"
excel_file = "output.xlsx"

pdf_text = pdf_to_text(pdf_file)
save_text_to_excel(pdf_text, excel_file)
[/code]
[b] output: [/b] " pypdf2.errors.deprecationError: reader.getNumpages снижается и удаляется в PYPDF2 3.0.0. Используйте len (reader.pages ) вместо. en/andal/user/migration-1-to -2.html, который утверждает, для обновления:
[/list]
reader.getnumpages ()/reader.numpages ➔ len (reader.pages) < /p>
[code]import PyPDF2
import openpyxl

def pdf_to_text(pdf_file):
text = ""
with open(pdf_file, "rb") as file:
pdf_reader = PyPDF2.PdfReader(file)
for page_num in range(pdf_reader.len(reader.pages)):
page = pdf_reader.getPage(page_num)
text += page.extractText()
return text

def save_text_to_excel(text, excel_file):
workbook = openpyxl.Workbook()
sheet = workbook.active
lines = text.split("\n")
for row_num, line in enumerate(lines, 1):
sheet.cell(row=row_num, column=1, value=line)
workbook.save(excel_file)

if __name__ == "__main__":
pdf_file = "PDF_File_name.pdf"
excel_file = "output.xlsx"

pdf_text = pdf_to_text(pdf_file)
save_text_to_excel(pdf_text, excel_file)
[/code]
[b] output: [/b] " attributeerror: 'pdfreader' объект не имеет атрибута 'len' " 
< ol start = "4">
 Я обновил код на основе комментариев Abdul Aziz Barkat ':
typo: pdf_reader.len (reader.pages) Сравните с Len (reader.pages ), как указано в сообщении об исчезновении ... вы должны написать LEN (pdf_reader.pages), Len - это встроенная функция в Python.  < /li>
< /ol>
[code]import PyPDF2
import openpyxl

def pdf_to_text(pdf_file):
text = ""
with open(pdf_file, "rb") as file:
pdf_reader = PyPDF2.PdfReader(file)
for page_num in range(len(pdf_reader.pages)):
page = pdf_reader.getPage(page_num)
text += page.extractText()
return text

def save_text_to_excel(text, excel_file):
workbook = openpyxl.Workbook()
sheet = workbook.active
lines = text.split("\n")
for row_num, line in enumerate(lines, 1):
sheet.cell(row=row_num, column=1, value=line)
workbook.save(excel_file)

if __name__ == "__main__":
pdf_file = "computers.pdf"
excel_file = "output.xlsx"

pdf_text = pdf_to_text(pdf_file)
save_text_to_excel(pdf_text, excel_file)
[/code]
[b]Вывод:[/b] "PyPDF2.errors.DeprecationError: reader.getPage(pageNumber) устарел и был удален в PyPDF2 3.0.0. Используйте Reader. вместо этого страницы[page_number]." 

Подробнее здесь: [url]https://stackoverflow.com/questions/76994667/update-python-code-the-pypdf2-library-has-deprecated-objects-used-in-python-co[/url]