6种让Python程序变慢的坏习惯
共 2463字,需浏览 5分钟
·
2021-09-27 08:23
大数据文摘授权转载自数据派THU
作者: Christopher Tao
翻译:王可汗
校对:王雨桐
随着Python的流行,用户数量也在增加。Python确实相对容易上手,也非常灵活,因此有更多可能的方式来实现一个函数。
当有多种方法可以实现一件特定的事情时,这意味着每种方法都有优缺点。在本文中,我收集了6种编写Python代码的典型方法,这些方法可能导致相对较差的性能。
不导入根模块
在使用Python时,我们无法避免的一件事就是导入模块,无论是内置模块还是第三方模块。有时我们可能只需要其中的一个或几个函数或对象。在这种情况下,我们应该只导入需要的函数或对象,而不是导入根模块。
这里有一个简单的例子。假设我们需要在程序中计算一些数字的平方根。
低效率示范:
在这个错误的示例中,我们导入了math模块,并使用math.sqrt()访问该函数。当然它可以运行,但是如果我们直接导入sqrt()函数,性能会更好。
高效率示范:
这比原来的快了25%。此外如果我们需要在程序中多次使用平方根函数,代码将会更整洁。
避免使用点/点链接
在Python中访问对象的属性或函数时,使用.是非常直观的。这种方法大多数时候都没有问题。然而如果我们能够避免使用点或点链接,那么性能便会变得更好。
低效率例子:
高效率例子:
如果你不相信它能起到同样的作用,我们可以验证一下。
注意:我可以预料到许多Python开发人员会跳出来说,这个例子中的技术有点可笑。事实上即使是我自己,也很少像上面那样写代码。然而我们应该知道怎样的代码是更高效的,可以使实现更快。
如果我们想要添加列表并从列表中移除项目,我们应该考虑使用这个技巧。这就是为什么我们需要平衡代码的性能和可读性。
不使用+连接字符串
字符串在Python中是不可变的。因此当我们使用“+”将多个字符串连接成一个长字符串时,每个子字符串都是单独操作的。
低效率例子:
具体来说,对于每个子字符串,它需要请求一个内存地址,然后将它与该内存地址中的原始字符串连接起来。这就产生了一种开销。
高效率例子:
然而当我们使用join()函数时,该函数事先知道所有子字符串,并根据最终的字符串长度分配内存地址。因此省去了为每个子字符串分配内存的开销。
注意点:强烈建议尽可能多地使用join()函数。然而,有时我们可能只想连接两个字符串。或者只是为了方便起见,我们想使用“+”。在这些情况下,使用“+”号可以获得更好的可读性和更短的代码长度。
不使用临时变量进行值交换
许多算法需要两个变量的值交换。在大多数其他编程语言中,通常要引入一个临时变量来实现,如下所示。
低效率示范:
很明显我们需要一个临时变量作为过渡。当变量b的值被传递给变量a时,它用于保存变量a的值,然后a的值可以被赋给变量b。
高效率示范:
然而在Python中,我们不需要使用临时变量。Python有如下内置语法来实现这个值交换。这不仅提升了效率,而且使代码更加整洁。
在if条件下使用短路逻辑(short-circuit)
短路计算在许多编程语言中都存在,Python也是如此。它指的是一些布尔运算符的计算逻辑,只有在第一个参数不足以确定整个表达式的值时,才执行或计算第二个参数。让我们用一个例子来演示。假设我们有如下列表。
my_dict = [ { 'name': 'Alice', 'age': 28 }, { 'name': 'Bob', 'age': 23 }, { 'name': 'Chris', 'age': 33 }, { 'name': 'Chelsea', 'age': 2 }, { 'name': 'Carol', 'age': 24 }]
我们的工作是筛选名单,找出姓名以“C”开头、年龄在30岁以上的所有人。
低效率示范:
有两个条件都需要满足:
名字以“C”开头 年龄≥30岁
原文标题:
Six Bad Manners that Make YourPython Program Slower
原文链接:
https://towardsdatascience.com/6-bad-manners-makes-your-python-program-slower-15b6fce62927