Python也可以合并和拆分PDF,批量高效!

共 863字,需浏览 2分钟

 ·

2024-04-16 20:14







PDF是最方便的文档格式,可以在任何设备原样且无损的打开,但因为PDF不可编辑,所以很难去拆分合并。


知乎上也有人问,如何对PDF进行合并和拆分?看很多回答推荐了各种PDF编辑器或者网站,确实方法比较多。


但这种软件的弊端在于很难去批量操作,比如你有几百个PDF要合并,使用软件会非常麻烦。


而且很多软件是收费的,本来PDF合并拆分也不是什么难事,赚的是信息差的钱。


我一般会用Python的PyPDF2库来编辑PDF,其中就包括合并、拆分多个PDF。


使用Python来实现的好处是处理PDF速度快,可大批量操作,而且免费。


话不多说,下面给出案例代码:该示例代码定义了两个函数 merge_pdf() 和 split_pdf(),分别用于合并和拆分 PDF。


这两个函数使用 PyPDF2 库读取 PDF 文件,然后使用 PdfFileMerger() 类创建一个合并后的 PDF 文件,或使用 getPage() 方法获取指定页码的页面,并将其添加到合并后的 PDF 文件中。


最后,使用 write() 方法将合并后的 PDF 文件写入磁盘。


在测试代码中,首先调用 merge_pdf() 函数将两个 PDF 文件合并,然后调用 split_pdf() 函数将合并后的 PDF 文件拆分为多个页面,并将这些页面保存到不同的文件中。


这个脚本需要安装 PyPDF2 库才能使用。可以使用 pip install PyPDF2 命令安装 PyPDF2 库。


具体代码可以在公众号后台回复:pypdf,获得py文件,亲测可用




















加入知识星球【我们谈论数据科学】


600+小伙伴一起学习!















浏览 1932
14点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
14点赞
评论
收藏
分享

手机扫一扫分享

分享
举报