独家 | 6种让Python程序变慢的坏习惯

数据派THU

共 3024字,需浏览 7分钟

 ·

2021-09-26 11:54

作者: Christopher Tao

翻译:王可汗

校对:王雨桐


本文约1800字,建议阅读5分钟

本文总结了Python代码中经常被忽略的影响代码的运行速度常见问题。


随着Python的流行,用户数量也在增加。Python确实相对容易上手,也非常灵活,因此有更多可能的方式来实现一个函数。

当有多种方法可以实现一件特定的事情时,这意味着每种方法都有优缺点。在本文中,我收集了6种编写Python代码的典型方法,这些方法可能导致相对较差的性能。

一、不导入根模块

在使用Python时,我们无法避免的一件事就是导入模块,无论是内置模块还是第三方模块。有时我们可能只需要其中的一个或几个函数或对象。在这种情况下,我们应该只导入需要的函数或对象,而不是导入根模块。

这里有一个简单的例子。假设我们需要在程序中计算一些数字的平方根。

低效率示范:


在这个错误的示例中,我们导入了math模块,并使用math.sqrt()访问该函数。当然它可以运行,但是如果我们直接导入sqrt()函数,性能会更好。

高效率示范:


这比原来的快了25%。此外如果我们需要在程序中多次使用平方根函数,代码将会更整洁。

二、避免使用点/点链接

在Python中访问对象的属性或函数时,使用.是非常直观的。这种方法大多数时候都没有问题。然而如果我们能够避免使用点或点链接,那么性能便会变得更好。

低效率例子:


高效率例子:


如果你不相信它能起到同样的作用,我们可以验证一下。

注意:我可以预料到许多Python开发人员会跳出来说,这个例子中的技术有点可笑。事实上即使是我自己,也很少像上面那样写代码。然而我们应该知道怎样的代码是更高效的,可以使实现更快。

如果我们想要添加列表并从列表中移除项目,我们应该考虑使用这个技巧。这就是为什么我们需要平衡代码的性能和可读性。

三、不使用+连接字符串

字符串在Python中是不可变的。因此当我们使用“+”将多个字符串连接成一个长字符串时,每个子字符串都是单独操作的。

低效率例子:


具体来说,对于每个子字符串,它需要请求一个内存地址,然后将它与该内存地址中的原始字符串连接起来。这就产生了一种开销。

高效率例子:


然而当我们使用join()函数时,该函数事先知道所有子字符串,并根据最终的字符串长度分配内存地址。因此省去了为每个子字符串分配内存的开销。

注意点:强烈建议尽可能多地使用join()函数。然而,有时我们可能只想连接两个字符串。或者只是为了方便起见,我们想使用“+”。在这些情况下,使用“+”号可以获得更好的可读性和更短的代码长度。

四、不使用临时变量进行值交换

许多算法需要两个变量的值交换。在大多数其他编程语言中,通常要引入一个临时变量来实现,如下所示。

低效率示范:


很明显我们需要一个临时变量作为过渡。当变量b的值被传递给变量a时,它用于保存变量a的值,然后a的值可以被赋给变量b。

高效率示范:

然而在Python中,我们不需要使用临时变量。Python有如下内置语法来实现这个值交换。这不仅提升了效率,而且使代码更加整洁。


五、在if条件下使用短路逻辑(short-circuit)

短路计算在许多编程语言中都存在,Python也是如此。它指的是一些布尔运算符的计算逻辑,只有在第一个参数不足以确定整个表达式的值时,才执行或计算第二个参数。让我们用一个例子来演示。假设我们有如下列表。

my_dict = [    {        'name': 'Alice',        'age': 28    },    {        'name': 'Bob',        'age': 23    },    {        'name': 'Chris',        'age': 33    },    {        'name': 'Chelsea',        'age': 2    },    {        'name': 'Carol',        'age': 24    }]

我们的工作是筛选名单,找出姓名以“C”开头、年龄在30岁以上的所有人。

低效率示范:

有两个条件都需要满足:

  • 名字以“C”开头

  • 年龄≥30岁


我们可以这样写代码。


高效率示范:

前面示例中的代码没有任何错误。然而在这个虚构的例子中,只有“Chris”的年龄超过30岁。

因此如果我们先写出检查名字的条件,则满足了3个名字(Chris, Chelsea, Carol)。然后检查这三个人的年龄是否满足第二个条件。

但是由于短路逻辑,如果我们先写年龄条件,只有Chris的年龄在30岁以上,我们会再次检查他的名字是否以“C”开头。


在这种情况下,它几乎快了100%。

六、如果可以使用for循环,就不要使用while循环

Python使用大量C语言来提高性能,即CPython。在循环语句方面,与while循环相比,Python中的for循环有相对较少的步骤,而更多的步骤是作为C代码运行的。

因此当我们可以在Python中使用for循环时,尽量避免使用while循环。这不仅是因为在Python中for循环更优雅,而且性能更好。

低效率示范:


高效率示范:


总结

在本文中,我列出了6个可以使Python程序更快的技巧。但是我们也需要特别注意的是,我们不应该总是把性能放在第一位。有时可读性和简洁性也应该考虑在内,这一切最重要的是平衡。

原文标题:
Six Bad Manners that Make YourPython Program Slower
原文链接:
https://towardsdatascience.com/6-bad-manners-makes-your-python-program-slower-15b6fce62927

编辑:黄继彦




译者简介






王可汗,清华大学机械工程系直博生在读。曾经有着物理专业的知识背景,研究生期间对数据科学产生浓厚兴趣,对机器学习AI充满好奇。期待着在科研道路上,人工智能与机械工程、计算物理碰撞出别样的火花。希望结交朋友分享更多数据科学的故事,用数据科学的思维看待世界。

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。


点击文末“阅读原文”加入数据派团队~



转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。



点击“阅读原文”拥抱组织



浏览 55
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报