Python之父:为什么要使用操作符?
共 2957字,需浏览 6分钟
·
2021-04-20 02:19
△点击上方“Python猫”关注 ,回复“1”领取电子书
这是我在 python-ideas 上发布的一些东西,但我认为这些很有趣,应该分享给更多的人。
最近有很多关于合并两个 dict 的运算符的讨论。(Python猫注:Guido 指的是 PEP-584 的字典合并操作符,文章写于 2019 年 3月,当时这个 PEP 刚刚诞生,后来已合入 Python 3.9。)
这促使我思考为什么有些人喜欢运算符,我想起了 30 多年前与导师 Lambert Meertens 的一次讨论。
对于数学家来说,运算符对于他们的思考方式至关重要。我们来选取一个简单的操作,比如将两个数相加,并尝试研究它的一些行为。
add(x, y) == add(y, x) (1)
式(1)表示了加法的交换律。它通常用运算符来书写,这使得它更简洁:
x + y == y + x (1a)
这似乎是一个小小的收获。
现在我们来考虑一下结合律:
add(x, add(y, z)) == add(add(x, y), z) (2)
式(2)可以用运算符重写:
x + (y + z) == (x + y) + z (2a)
这比式(2)容易理解得多,并且我们发现括号是多余的,所以现在我们可以这样写:
x + y + z (3)
没有歧义(+ 运算符绑定到左边还是右边并不重要)。
许多其他定律也可以很容易的使用运算符来写。这里还有一个关于加法恒等元素的例子:
add(x, 0) == add(0, x) == x (4)
相比于
x + 0 == 0 + x == x (4a)
这里的总的思想就是一旦你学会了这个简单的表示法,用它们写的方程就比用函数表示法写的方程更容易“操作”——就好像我们的大脑用不同的大脑机制来掌握运算符,这是更有效率的方法。
我认为,使用运算符编写的公式更容易被“视觉化”处理就与此有关: 它们利用了大脑的视觉处理机制,而这一机制在很大程度上是在潜意识中运作的,并且它会告诉大脑的意识部分它看到了什么(比如,“椅子”而不是“几块木头连在一起”)。函数符号在我们的大脑中则必须走一条不同的路径,这是无意识的(它与内容的阅读和理解有关,这是在比视觉处理更晚的年龄段才学会/训练的)。
当你将多个运算符结合在一起时,视觉处理的功能就会变得非常明显。例如,考虑一下分配律:
mul (n,add(x, y)) == add(mul (n, x) mul (n, y)) (5)
这写起来很恼火,我相信一开始你是不会看到这个规律的(或者至少你不会立刻看到它,如果我没有提到这是分配律的话)。
与下式比较:
n * (x + y) == n * x + n * y (5a)
注意,这里也使用了相对的运算符优先级。通常数学家们会把它写得更紧凑:
n(x+y) == nx+ny (5b)
但是,遗憾的是,目前这超出了 Python 解析器的能力。
运算符表示法的另一个非常强大的方面是,可以方便地将它们应用于不同类型的对象。例如,定律(1)到(5)在x、y和z是相同大小的向量,而n是标量(用0向量代替字面量“0”)时也适用,如果它们是矩阵(同样,n必须是一个标量)也适用。
你可以这样处理不同域中的对象。例如,上面的定律(1)到(5)也适用于函数(n也是一个标量)。
通过明智地选择运算符,数学家们可以运用他们的视觉大脑来帮助他们更好地进行数学研究: 他们会更快地发现新的有趣的定律,因为有时黑板上的符号就会跳到你面前,给你提供一条通往难以捉摸的数学证明的道路。
现在,编程并不完全等同于数学,但我们都知道可读性很重要,这就是 Python 中运算符重载的作用。一旦你内化了运算符具有的简单属性,使用+号进行字符串或列表连接将比纯 OO 表示法更具可读性,上面(2)和(3)解释了(部分程度上)为什么是这样。
当然,这样做绝对有可能做过火——然后你就会使用 Perl。但我认为,那些指出“已经有办法做到这一点”的人忽略了一点,即真正理解这一点是比较容易的:
d = d1 + d2
和下面相比:
d = d1.copy ()
d.update(d2)
这不仅仅是少了几行代码的事: 第一种形式允许我们使用我们的视觉处理,以帮助我们更快的看到它的意思,并且不会影响我们大脑的其他部分(例如,这些部分可能已经被跟踪 d1 和 d2 的意思占据)。
当然,任何事情都是有代价的。你必须学习运算符,并且在应用于不同对象类型时必须学习它们的属性。(数学中也是如此——对于数字,xy == yx,但是这个属性不适用于函数或矩阵; 另一方面,正如结合律一样, x+y == y+x 适用于所有情况。)
“但是性能呢?”我听见你这样问。好问题。在我看来,可读性第一,性能第二。 在基本的例子(d = d1 + d2)中,与使用 update 的两行代码版本相比,没有性能损失,而且可读性明显提高。
我能想到很多情况,性能差异无关紧要,但可读性是最重要的,对我来说,这是默认的假设(即使在 Dropbox——我们最重要的性能代码已经用丑陋的 Python 或 Go 重写过了)。对于少数性能至关重要的情况,很容易将运算符版本转换为其他版本——一旦你认为这很有必要 (可能是通过分析得出的)。
还不过瘾?试试它们