pdf-extraction

PDFPY2读取故障

打开PDF文件pdf_file=打开(文件,'rb')创建PDF阅读器对象pdf_reader=PyPDF2.PdfFileReader(pdf_file)获取PDF文件中的页数pages=pdf_reader.numPages初始化变量以存储提取的文本文本=“”循环浏览每一页forpageinrange(pages):#获取当前页面pdf_page=pdf_reader.getPage(page