Python自动化办公:读取Excel数据并批量生成合同
俊红的数据分析之路
共 2583字,需浏览 6分钟
· 2022-05-31
二、准备
我们首先要准备好一份合同模板(Word),将需要替换的合同数据用{{}}表示,如下:
三、实战
1.安装相关库
openpyxl是一个操作Excel非常好用的库,功能相对于xlrd、xlwt来说更为完整,我们首先安装它:
pip install openpyxl
docxtpl 是一个操作Word非常好用的库,其主要通过对docx文档模板加载,从而对其进行修改,我们也安装下这个库。
pip install docxtpl
2.读取合同数据
我们可以通过load_workbook方法打开合同数据(Excel表),然后读取每一个合同数据并存入到data字典,再将每个字典放入到列表datas中。PS:由于读取的签约日期是一个时间戳,需要通过strftime方法转为标准的年月日格式。
from docxtpl import DocxTemplate
from openpyxl import load_workbook
wb = load_workbook("合同数据.xlsx")
ws = wb['Sheet1']
datas = []
for row in range(2, ws.max_row):
name1 = ws[f"A{row}"].value
name2 = ws[f"B{row}"].value
price = ws[f"C{row}"].value
product = ws[f"D{row}"].value
count = ws[f"E{row}"].value
deadline = ws[f"F{row}"].value
time = ws[f"G{row}"].value
time = time.strftime("%Y-%m-%d")
data = {"甲方": name1,
"乙方": name2,
"合同价款": price,
"产品名称": product,
"产品数量": count,
"付款期限": deadline,
"签约时间": time}
datas.append(data)
datas
当然,我们也可以通过pandas大法来读取合同数据,主要运用到dataframe_to_rows方法,将pandas格式的数据转为一行一行的数据。index=False表示不需要索引,header=False表示不需要表头。
import pandas as pd
from openpyxl.utils.dataframe import dataframe_to_rows
df = pd.read_excel("合同数据.xlsx")
df["签约日期"] = df["签约日期"].apply(lambda x:x.strftime("%Y-%m-%d"))
datas = []
for row in dataframe_to_rows(df,index=False,header=False):
data = {"甲方": row[0],
"乙方": row[1],
"合同价款": row[2],
"产品名称": row[3],
"产品数量": row[4],
"付款期限": row[5],
"签约时间": row[6]}
datas.append(data)
datas
我们可以打印datas,效果如下:
[{'甲方': 'J哥',
'乙方': '老王',
'合同价款': 1000000,
'产品名称': '菜J学Python',
'产品数量': 1,
'付款期限': 30,
'签约时间': '2022-05-20'},
{'甲方': 'K哥',
'乙方': '张三',
'合同价款': 20000,
'产品名称': '冰箱',
'产品数量': 2,
'付款期限': 40,
'签约时间': '2022-05-21'},
{'甲方': 'C哥',
'乙方': '李四',
'合同价款': 30000,
'产品名称': '电脑',
'产品数量': 3,
'付款期限': 50,
'签约时间': '2022-05-22'},
{'甲方': 'B哥',
'乙方': '王五',
'合同价款': 40000,
'产品名称': '洗衣机',
'产品数量': 4,
'付款期限': 60,
'签约时间': '2022-05-23'},
{'甲方': 'P哥',
'乙方': '赵六',
'合同价款': 50000,
'产品名称': '微波炉',
'产品数量': 5,
'付款期限': 70,
'签约时间': '2022-05-24'}]
3.批量合同生成
这里运用for语句遍历每一个合同数据data(字典格式),打开合同模板,并将data替换掉合同模板中的数据,然后保存为新的销售合同。
for data in datas:
tpl = DocxTemplate('合同模板.docx')
tpl.render(data)
tpl.save(f'合同生成/{data["甲方"]}的销售合同{data["签约时间"]}.docx')
print(f'{data["甲方"]}的销售合同已生成')
代码运行后,效果如下:
打开其中一个销售合同,效果如下:
对比Excel系列图书累积销量达15w册,让你轻松掌握数据分析技能,可以在全网搜索书名进行了解选购:
评论
金融研究 | 使用Python测量关键审计事项的「信息含量」
Tips: 公众号推送后内容只能更改一次,且只能改20字符。如果内容出问题,或者想更新内容, 只能重复推送。为了更好的阅读体验,建议阅读本文博客版, 链接地址https://textdata.cn/blog/2023-01-13-information-content-of-critical-aud
大邓和他的Python
0
金融研究(更新) | 使用Python构建关键审计事项的「信息含量」
Tips: 公众号推送后内容只能更改一次,且只能改20字符。如果内容出问题,或者想更新内容, 只能重复推送。为了更好的阅读体验,建议阅读本文博客版, 链接地址https://textdata.cn/blog/2023-01-13-information-content-of-critical-aud
大邓和他的Python
0
谷歌员工爆料 Python 基础团队原地解散
转自 | 机器之心编辑 | 蛋酱什么?谷歌解雇了整个 Python 基础团队?「当与你直接共事的每个人,包括你的主管,都被裁员 —— 哦,是职位被削减,而你被要求安排他们的替代者入职,这些人被告知在不同的国家担任同样的职位,但他们并不为此感到高兴,这是很艰难的一天。」发布这一动态的 Tho
机器学习算法与Python实战
0
FaceChain高保真人像风格生成挑战赛:一等奖方案
Datawhale分享 作者:马琦钧,Datawhale成员简 介大家好,我是马琦钧,Datawhale成员,毕业于浙江农林大学,统计学/会计学双学位,获得过由阿里云、谷歌、百度、CVPR、思否、极棒等举办的相关赛事奖项。本次主要分享 FaceChain 高保真人像风
Datawhale
1
多人同时导出 Excel 干崩服务器!新来的阿里大佬给出的解决方案太优雅了!
点击关注公众号,Java 干货及时推送↓推荐阅读:面试辅导,我们出大成果了!来源:juejin.cn/post/7259249904777838629前言 业务诉求:考虑到数据库数据日渐增多,导出会有全量数据的导出,多人同时导出可以会对服务性能造成影响,导出涉及到mysql查询的io操作,
Java技术栈
1
OpenAI的Sora竟然造假:生成的AI大片只有1%的AI,剩下的99%是人工!
点蓝色字关注“机器学习算法工程师”设为星标,干货直达!啊?Sora火爆短片《气球人》,也“造假”了???背后艺术家团队的最新揭秘,可谓一石激起千层浪:原来,视频画面并非完全由AI生成,其中有大量视觉效果需要人类后期实现。be like:这下网友不干了,合着大家伙儿跟OpenAI玩真心,OpenAI背
机器学习算法工程师
1
谷歌员工爆料Python基础团队原地解散
机器之心报道编辑:蛋酱什么?谷歌解雇了整个 Python 基础团队?「当与你直接共事的每个人,包括你的主管,都被裁员 —— 哦,是职位被削减,而你被要求安排他们的替代者入职,这些人被告知在不同的国家担任同样的职位,但他们并不为此感到高兴,这是很艰难的一天。」发布这一动态的 Thomas Wouter
机器学习初学者
0
Python加速运行技巧
Python 是一种脚本语言,相比 C/C++ 这样的编译语言,在效率和性能方面存在一些不足。但是,有很多时候,Python 的效率并没有想象中的那么夸张。本文对一些 Python 代码加速运行的技巧进行整理。 0. 代码优化原则 本文会介绍不少的 Python 代码加速运行的技巧。在深入代码优化细
机器学习算法与Python实战
0