PyPDF2.errors.DeprecationError: PdfFileReader is deprecated and was removed in PyPDF2 3.0.0. Use PdfReader instead.
272浏览 · 2024-01-06 19:32:27
非常抱歉,我之前给出的[代码](https://geek.csdn.net/educolumn/1572ef9b473b4e00f6b2bf6d428b7c27?spm=1055.2569.3001.10083)确实有问题。在PyPDF2[版本](https://geek.csdn.net/educolumn/04449e2eb7da35a9c72dce97dbf43e2a?spm=1055.2569.3001.10083)3.0.0中,`PdfFileReader`类已经被弃用并移除了,应该使用`PdfReader`类替代。以下是更新后的[代码](https://geek.csdn.net/educolumn/1572ef9b473b4e00f6b2bf6d428b7c27?spm=1055.2569.3001.10083)示例:
```python
import PyPDF2
pdf_file = open('path/to/pdf/file.pdf', 'rb')
pdf_reader = PyPDF2.PdfReader(pdf_file)
num_[page](https://geek.csdn.net/educolumn/1c66455c37fe0c4b32e4414c4c6aeead?spm=1055.2569.3001.10083)s = len(pdf_reader.pages)
for page in range(num_pages):
pdf_page = pdf_reader.pages[page]
page_content = pdf_page.extract_text()
print(page_content)
pdf_file.close()
请确保将`'path/to/pdf/file.pdf'`替换为实际的PDF文件路径。现在应该使用`PdfReader`类来代替已弃用的`PdfFileReader`类。使用`len(reader.pages)`来获取页面数量,并使用`reader.pages[page]`来获取每个页面的[对象](https://geek.csdn.net/educolumn/04c51611e4b730957464192e0307b82c?spm=1055.2569.3001.10083)。然后可以使用`.extract_text()`方法提取页面的文本内容。最后,不要忘记使用`.close()`方法关闭PDF文件。感谢你的理解!
相关问题
非常抱歉,我之前的代码是在 PyPDF2 2.x 版本上测试的,而在 PyPDF2 3.x 版本中,`PdfFileReader` 已经被废弃了,需要使用 `PdfR
这个错误提示是因为 PyPDF2 库中的 PdfFileReader 已经被弃用,需要改为使用 PdfReader。你需要修改你的代码,将 PdfFileReader 替换为 PdfReader。
具体的修改方法如下:
1. 找到你的代码中使用到了 PdfFileReader 的地方。
2. 将 PdfFileReader 改为 PdfReader。
3. 保存修改后的代码并重新运行。
修改后的代码示例:
from PyPDF2 import PdfReader
pdf = PdfReader('example.pdf')