Python循环、列表生成器、filter效率对比试验

咪哥杂谈

共 1401字,需浏览 3分钟

 ·

2019-08-19 07:26

U5GEOXDFix.jpg


本篇阅读时间约为 5 分钟。


前言


在编程的过程中,大家肯定会遇到一个场景,就是类似在 list、set、tuple 中根据某些条件进行过滤,筛选过后生成新的元素列表。


对于这个场景而言,在 Python 中有许多中不同的方案可以去解决,那么哪一种才是效率最高的?今天就来小小的做个实验体验下。


环境介绍


两台 windows 电脑,Python 版本均为 3.0+ 。代码相同,不同的是 CPU。


笔者 CPU 型号:


TGaJWvv3o1.png


同学 CPU 型号:

ItHyv9CqXK.png

DX3o1aCb0x.png

测试场景代码


假设现在的场景是有一个含有 1000 个数字的列表,其中这个列表中包含正数和负数,如果让你将所有正数挑选出来并且生成新的列表,如何解决?(如果看过笔者之前小课堂的示例,就知道方案都介绍过。)


生成 1000 个 -100 到 100 的随机list:


from timeit import timeit
import random

random.seed(10)  # 为了让每次随机结果相同,设置随机种子
x_list = [random.randint(-100, 100) for _ in range(1000)]


思考过后再往下看:


方案一,最常规写法 for 遍历:


def for_func():
    """ for 循环测试 """
    new_list = []
    for x in x_list:
        if x > 0:
            new_list.append(x)
    return new_list


方案二,列表生成式:


new_list = [x for x in x_list if x > 0]


方案三,filter高级函数:



new_list = list(filter(lambda x: x > 0, x_list))

测试效率


在 Python 中,有一个模块叫 timeit,此模块可以直接进行效率测速,来简单的看下官方文档如何介绍的:


TcLcrBzruw.jpg


如果大家有所了解,Python 解释器是有不同版本的,平时我们用的是 CPython 解释器,上面的方法即 CPython 的用法。若是在 IPython 中,则可以直接用 timeit xxxx 来进行使用。


在 CPython 中,我选择的是图中红框部分的示例代码来做演示:


0oNPePk3Eo.png


如果 number 参数不写的话,默认是循环 100000 次来执行。在测试用例中,number 默认,可以进源码查看:


D9ZQoHCCZr.png


测试用例元素个数 1000 ,每种写法循环测试 100000 次。


结果,

我的:


3LDpIOZhq6.png


同学的:


QketpuiyuB.png


测试用例元素个数 100 ,每种写法循环测试 100000 次。


结果,

我的:


U82VvjOz0K.png


同学的:

BNFMp3hVN4.png

拓展


关于字典和集合,也是可以使用生成器形式来进行此场景过滤的,回顾:python小课堂34 - 推导式与生成器


总结


综上所述,在此场景下,效率最高的列表推导式,若是简单的逻辑,推荐大家使用列表推导式写法,如果推导式满足不了需求,在考虑另外两种。


浏览 34
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报