使用Python制作WORD报告

数据森麟

共 2509字,需浏览 6分钟

 ·

2020-03-25 23:28

0223cbf5aae80c18863ef0b21a01bd60.webp


     作者:大邓


     来源:大邓和他的Python

8d3952ac46d84a1aa0535cbef47892aa.webp

在前面一期文章 使用Pandas、Jinja和WeasyPrint制作pdf报告 中我分享了如何使用HTML模板来创建pdf报告的方法。虽然pdf很不错,但更多的人实际上在用微软的WORD来操作文档。实际上对于用户来说,创建所需的模板会更加简单,该模板支持Word中所需的所有自定义格式,而不是尝试使用HTML + CSS。幸运的是,有一个库支持在python中进行MS Word 邮件合并。这种方法的优点是可以在任何系统上运行 - 即使没有安装Word。 


背景




使所有这一切成为可能的包叫做 docx-mailmerge它是一个成熟的包,可以解析MS Word docx文件,找到 合并字段 并将您需要的任何值填充给它们。该包还支持一些辅助函数,用于填充表并生成具有多个分页符的单个文件。我知道标准的Word方法是将此进程称为 mailmerge ,但本文中的这个 “mailmerge” 可以是一个有用的模板系统,可以用于更复杂的解决方案,而不仅仅是填充文档中的 名称和地址

安装

docx-mailmerge 需要依赖 lxml ,所以需要先安装lxml,再安装 docx-mailmerge
pip install lxml
pip install docx-mailmerge



Word合并字段




为了使docx-mailmerge正常工作,您需要创建标准Word文档,并定义适当的 合并字段 。以下示例适用于Word 2016.其他版本的Word应该类似。实际上花了我一段时间来弄清楚这个过程,但是一旦你做了几次,这很简单。启动Word并创建基本文档结构。然后将光标放在应插入 数据的位置,并选择插入 - > 域

5fe084eac828693e0c0fcff44f6f6ce5.webp

从“字段”对话框中,从“字段名称”列表中选择“MergeField”选项。在“字段名称”中,输入字段所需的名称。在这种情况下,我们使用的是商业名称。
单击确定后,您应该在Word文档中看到类似这样的内容:<< From >>。您可以继续创建包含所有必填字段的文档。

41206b7f497b3ed560847873f9883462.webp

简单的合并




创建Word文档后,填充字段值是一项很简单的操作。

from mailmerge import MailMerge
import datetime

template = "PracticalPython.docx"

我们的 PracticalPython.docx 文件可以看做是用来给大家群发新年祝福邮件模板。

958e72d20a4eee2b8aad0d81e9182f4e.webp

下面我们先看看docx文档中有哪些合并字段

document = MailMerge(template)

print(document.get_merge_fields())
{'From', 'date', 'FromUserName', 'To', 'ToUserName'}

我们发现 PracticalPython.docx 文档中有我们上图邮件模板中设计的几个 合并字段,如 From, date, FromUserName, To, ToUserName 。下面我们对这几个变量进行填充。

document.merge(
   From='123456dadeng@qq.com',
   FromUserName='大邓',
   To = '654321guanzhuzhe@qq.com',
   ToUserName='关注者的昵称',
   date='{:%d-%b-%Y}'.format(datetime.date.today())
)

#输出的docx文件
document.write('output.docx')

这是简单的Word文档填充效果

39849aebb47733fa58582a2a4f3621fa.webp

插入表格




生成模板时的另一个常见需求是有效地填充值表格中的值。在我们的示例中,我们可以在包含客户购买历史的信件上附上展览。在完成模板时,我们不知道要包含多少行,并且 每个字段 的填充将会非常快。使用merge_rows可以使表格填充更容易。在本部分构建模板,请创建一个包含1行的标准Word表,并将字段插入相应的列中。无需特殊格式。它应该看起来像这样:

d3465c99d324f283fae54f283d6b966a.webp

现在我们定义了一连串的字典,用于填充到表格中去
document2 = MailMerge('purchasehistory.docx')

sales_history = [{
   'prod_desc': 'Red Shoes',
   'price': '$10.00',
   'quantity': '2500',
   'total_purchases': '$25,000.00'}, {
   'prod_desc': 'Green Shirt',
   'price': '$20.00',
   'quantity': '10000',
   'total_purchases': '$200,000.00'}, {
   'prod_desc': 'Purple belt',
   'price': '$5.00',
   'quantity': '5000',
   'total_purchases': '$25,000.00'}]

document2.merge_rows('prod_desc', sales_history)
document2.write('output-table.docx')
最终结果是每行填充了我们需要的值,并保留了我们在模板文档中定义的默认表格式:

879e790598a5c09e1ecd56a31356bc22.webp

◆ ◆ ◆  ◆ 




长按二维码关注我们



数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。


管理员二维码:



猜你喜欢

 笑死人不偿命的知乎沙雕问题排行榜

 用Python扒出B站那些“惊为天人”的阿婆主!

 互联网大佬学历&背景大揭秘,看看是你的老乡还是校友

 上万条数据撕开微博热搜的真相!

 你相信逛B站也能学编程吗?

浏览 56
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报