[Python]:关于截取pdf中的某些页

3/8/2017来源:ASP.NET技巧人气:1924

PyPDF2

python对于处理一些日常繁琐事物来说是很便捷的,比如今天我们要说的pdf操作。 需求如题,想从一个pdf文件中截取出指定的页面。我用的工具是py2pdf。 首先,我们需要读取待处理pdf文件。

import PyPDF2 as pdf inputfile = "/path/to/your/pdf/file" outputfile = "/path/to/your/new/pdf/file" reader = pdf.PdfFileReader(inputfile) pages = [num1, num2, num3, ..., numn] getpages = list() for i in pages: page = reader.getPage(i-1) #page number starts with 0 getpages.append(page)

到此,所需要的页面都已经读取出来并存放在getpages中。下一步就是将读取出来的页面按顺序写进指定的PDF文件中。

writer = pdf.PdfFileWriter() for page in getpages: writer.addPage(page) with open(outputfile,'a+') as fh: writer.write(fh)

大功告成!