Python处理Excel的另一个库-openpyxl

共 2666字,需浏览 6分钟

 ·

2020-01-06 23:20

咪哥杂谈


8dc3198948536bcfa5073375ea7033df.webp

本篇阅读时间约为 5 分钟。


1

前言


上篇文章中,介绍了如何使用 Pandas 来操作处理 Excel 和 Csv 文件。其中留下了一个点,即图片头像现在在 Excel 中依然是地址,现在需要将地址转为图片,写入到 Excel。


今天来介绍另一个好用的库 openpyxl ,Python操作处理 Excel 的神库。


回顾上篇文章详见:Python处理Excel&CSV文件



2

环境准备


开始之前,需要安装的第三方库有两个:


pip install openpyxlpip install pillow


第一个是操作 Excel 的,第二个则是和图片相关的库,早期的文章用到过。

3

代码演示


由于使用 openpyxl 库,每个操作都可以抽象成一个方法,所以我将大部分常用的操作封装成了一个类来使用。
下面来简单介绍下我完成这次图片写入用到的功能,完整代码文末提供地址:
1. 初始化时加载,读和写的操作对象

class Excel(object):    def __init__(self, file):        self.file = file        self.wb = load_workbook(self.file)  # 加载,可读        sheets = self.wb.sheetnames  # 获取所有sheet页        self.sheet = sheets[0]  # 默认第一sheet页        self.ws = self.wb[self.sheet]  # 切换到sheet页

self.wb 是读 Excel 时用到的,self.ws 则是写入时用到的。


2. 获取某列的所有值


由于我需要读取头像图片地址,所以就得需要这一列的地址:


e610ec4a5d819a1efc4df726a8ebf5c1.webp


class Excel(object):    # 获取某列的所有值    def get_col_values(self, column):        rows = self.ws.max_row        column_data = []        for i in range(1, rows + 1):            cell_value = self.ws.cell(row=i, column=column).value            column_data.append(cell_value)        return column_data

注意,这里的 column 是从 1 开始的Excel 中 A 列意味着 column 等于 1,所以传值的时候注意列数的数字。

3. 重塑图片大小,重新写入文件,设置行高列高。


重塑图片,用到了 pillow 库,把本地的图片大小规划为 75 像素的宽高。
重新定义图片大小是为了整齐,从网站下载下来的图片大小不一。


from PIL import Image as PILImageimg= PILImage.open(img_path)image = img.resize((75, 75), PILImage.ANTIALIAS)  # 重构图片大小,设置为 75 像素image.save(img_path)


定义单元格行高:


 class Excel(object):    # 设置单元格宽度和高度    def set_cell_height(self, row, col, row_height, column_weight):        self.ws.row_dimensions[row].height = row_height        self.ws.column_dimensions[col].width = column_weight

4. 设置某列的值


通过 requests 库读取到图片,落地,再次设置图片。


ef5bc8fad0ebafd11d73980501cd067c.webp


classExcel(object):    # 设置某个单元格的值    def set_cell_value(self, row, column, cell_value):        try:            if isinstance(cell_value, Image):                self.ws.add_image(cell_value, f'{row}{column}')            else:                self.ws.cell(row=row, column=column).value = cell_value        except Exception as e:            self.ws.cell(row=row, column=column).value = "None"


5. 保存文件


为了灵活性,如果你使用此方法传进名字,则新创建文件,否则保存覆盖之前加载的文件。


class Excel(object):    # 保存文件    def save_file(self, file_name=None):        if file_name:            self.wb.save(file_name)        else:            self.wb.save(self.file)


可以看到这样是不是就很整齐了呢?


146185b04901e6db09777162da8435fe.webp


4

使用对比pandas库处理Excel


通过这两篇文章比较,个人觉得还是 pandas 库操作数据方便些。但不同场景下使用也不同。


比如我要写入图片,可能 pandas 支持就不那么好,但比如我想合并多个 Excel ,那无疑使用 pandas 的 concat  数要简单的多。


可以说,openpyxl 库更多地是对 Excel 细节操作的实现,而 Pandas 多数注重于数据的处理,大家根据自己的场景需求选择使用就好~


5

总结


到这里,对于王者荣耀的相关数据以及 Excel 算是处理完了,下面就准备分析分析了,看看能从这批数据中看到些什么。
有想看这章完整代码的朋友,可以后台回复 最终王者 即可获得。


题图 :


Tirachard Kumtanom - pexels



▼往期精彩回顾▼Python处理Excel&CSV文件pyspider爬取王者荣耀数据(上)
pyspider爬取王者荣耀数据(下)



11f5b18c847e4cdc56957f98d8c9a1a3.webp你点的每个在看,我都认真当成了喜欢


浏览 48
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报