【Python】如何用Python来操作PDF文件,建议收藏
机器学习初学者
共 2265字,需浏览 5分钟
·
2021-08-29 10:42
1. 通过Python脚本来创建PDF文件
2. 加密或给PDF文件上锁
3. 将多份PDF文件合并起来
4. 给PDF文件上水印
好,那就由小编一个一个来给大家演示看
我们首先来创建一个PDF文件,在下面的代码当中我们是用“reportlab”的模块,要是该模块没有被安装的话,可以通过下面的命令行来进行安装
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple reportlab
然后创建PDF文件的代码,在文件当中输入“Hello World”内容,默认的输入是从左上角开始输入,
from reportlab.pdfgen import canvas
report = canvas.Canvas("file1.pdf")
report.drawString(50, 800, "This is an example for Medium")
report.save()
有一些PDF文件当中有重要的内容,需要将其加密、上锁,我们可以通过以下的代码来实现,用到的密码是“hello”,结果会新生成一个加密过后的PDF文件叫做“new_encrypted.pdf”,代码如下
from PyPDF2 import PdfFileReader, PdfFileWriter
encrypted_file = PdfFileWriter()
original = PdfFileReader("棉花.pdf")
number_of_pages = original.numPages
for i in range(number_of_pages):
page = original.getPage(i)
encrypted_file.addPage(page)
password = "hello"
encrypted_file.encrypt(password)
with open("new_encrypted.pdf", "wb")as file:
encrypted_file.write(file)
下面,我们将通过几行Python的代码来实现两个PDF文件的合并,我们用到了“PdfFileMerger()”方法,代码如下
from PyPDF2 import PdfFileReader, PdfFileMerger
first_file = PdfFileReader("棉花.pdf")
second_file = PdfFileReader("30岁将就.pdf")
output = PdfFileMerger()
output.append(first_file)
output.append(second_file)
output.write("new_merged.pdf")
有时候我们需要给PDF文件添加水印,原理是我们手上有两个PDF文件,其中一个PDF文件是没有水印的,另外一个是有水印的,我们将这两个PDF文件合并,并且生成一个新的PDF文件
from PyPDF2 import PdfFileReader,PdfFileWriter
original_file = "file1.pdf"
watermarked_pdf = "PDF_watermarked.pdf"
output_file = "output.pdf"
input_file = open(original_file, 'rb')
input_pdf = PdfFileReader(input_file)
watermark_file = open(watermarked_pdf, 'rb')
watermark_pdf = PdfFileReader(watermark_file)
watermark_page = watermark_pdf.getPage(0)
pdf_page = input_pdf.getPage(0)
pdf_page.mergePage(watermark_page)
output = PdfFileWriter()
output.addPage(pdf_page)
output_file = open(output_file, 'wb')
output.write(output_file)
output_file.close()
watermark_file.close()
input_file.close()
往期精彩回顾 本站qq群851320808,加入微信群请扫码:
评论