我用python,帮朋友写了一个“制作工资条”的自动化程序!

共 3474字,需浏览 7分钟

 ·

2020-08-08 19:14

作者:黄伟呢

本文转自:数据分析与统计学之美


本文说明

周末和一个朋友吃饭,她说我经常使用Excel制作工资条,但是每个月都要做一遍。你能不能用python写一个代码,能够自动化完成这个工作,这当然可以啦,就是这么牛逼!

我们先来看看原始数据是什么样子的。

那么最后做成的效果是什么样子的呢?

这就很方便了,不管你公司有多少人,只要你把原始数据丢给我,我都可以秒出一个工资条,省得每次都需要使用Excel操作一遍,并且数据多了Excel还会卡顿。

代码逻辑剖析

那么这样一个程序,是怎么写的呢?

其实只要是逻辑想清楚了,剩下的就是写代码的事儿了。下面我就带着大家梳理一下,这段代码的逻辑。

首先,我们应该是读取Excel表格。然后需要拷贝其中一个sheet表到另外一张sheet表,并给sheet命名。这样做的目的:为了存放制作好工资条的那张sheet表。

import re
import openpyxl
from copy import copy

wb = openpyxl.load_workbook('工资条.xlsx')
# copy_worksheet():拷贝sheet表 
wb.copy_worksheet(wb['工资条'])
# worksheets:以列表的形式返回所有的Worksheet(表格)
ws = wb.worksheets[-1]
ws.title = 'final_工资条'

可能这样说,大家还是不知道上述代码到底是什么意思?我下面截一张图给大家,其实就可以很好的说明上述函数的含义了。

接着,就需要给每一行数据前面添加一个表头。由于后面每一行表头的样式,都与第一行完全一模一样的,因此我们需要复制第一行表头中的样式。

def cell_style(cell):
    alignment = copy(cell.alignment)    # 对齐样式
    border = copy(cell.border)          # 边框样式
    fill = copy(cell.fill)              # 填充样式
    font = copy(cell.font)              # 字体样式
    return alignment, border, fill, font
    
# 获取标题行中,每个单元格中的各种样式
alignment, border, fill, font = cell_style(cell=cells_rows[0][0])

从上面的代码中可以看到:我定义了一个函数,使用copy库中的copy()方法,直接拷贝单元格的4大样式。因为原表第一行中每个单元格的4大样式,都是完全一致的,因此我们直接获取第一个单元格的样式即可

最后这一part是整个代码中最精彩的部分,不太好叙述,大家仔细研究一下下方的注释。

for i, _ in enumerate(cells_rows[1:]):
    if i > 0:
        index = i*3
        # 每循环一次,就在对应位置下方插入2行。1行是空行,1行是表头行。
        ws.insert_rows(idx=index, amount=2)
        # 因为每次插入2行,所以需要在表头行那里,将表头及其样式写入。
        for j, v in enumerate(header):
            r, c = index+1, j+1
            cell = ws.cell(row=r, column=c)
            cell.value = v
            cell.alignment = alignment
            cell.font = font
            cell.border = border
            cell.fill = fill
            # 更新后面的公式
            if cell.coordinate[:1in ('H''J'):
                cell = ws.cell(row=r+1, column=c)
                cell.value = re.sub('\d+', str(r+1), cell.value)

这里需要特别说明一点的就是更新公式。就拿第一次循环来说,我们在第3行的位置,插入了2个空白行。那么原本第3行的数据,此时就被挤到了第5行。

注意:它是被迫挤到第5行的,因此这一整行是原封不动搬到第5行的,包括它原来的公式。原来在第3行的时候,如果公式是SUM(E3:G3),被挤到到了第5行后,应该是SUM(E5:G5),但是它仍然是SUM(E3:G3)因为它是被迫的,所以需要我们修改公式,上述代码中正是使用正则将这个数字3改为了5。

完整代码

import re
import openpyxl
from copy import copy

def cell_style(cell):
    alignment = copy(cell.alignment)    # 对齐样式
    border = copy(cell.border)          # 边框样式
    fill = copy(cell.fill)              # 填充样式
    font = copy(cell.font)              # 字体样式
    return alignment, border, fill, font

wb = openpyxl.load_workbook('工资条.xlsx'
wb.copy_worksheet(wb['工资条'])
ws = wb.worksheets[-1]
ws.title = 'final_工资条'

# 获取每一列的值,拼接在一个列表中
cells_rows = [[cell for cell in row] for row in ws.rows]

# 获取标题
header = [cell.value for cell in cells_rows[0]]

# 获取标题行中,每个单元格中的各种样式
alignment, border, fill, font = cell_style(cell=cells_rows[0][0])

for i, _ in enumerate(cells_rows[1:]):
    if i > 0:
        index = i*3
        # 每读取一行,就在下方插入两行
        ws.insert_rows(idx=index, amount=2)
        # 写表头
        for j, v in enumerate(header):
            r, c = index+1, j+1
            cell = ws.cell(row=r, column=c)
            cell.value = v
            cell.alignment = alignment
            cell.font = font
            cell.border = border
            cell.fill = fill
            # 更新后面的公式
            if cell.coordinate[:1in ('H''J'):
                cell = ws.cell(row=r+1, column=c)
                cell.value = re.sub('\d+', str(r+1), cell.value)
# 整个代码写完后,一定要记得保存               
wb.save('工资条.xlsx')    
恋习Python

关注恋习Python,Python都好练

好文章,我在看❤️
浏览 39
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报