Python 中那些令人防不胜防的坑
作者:Rocky0429
来源:Python空间
大家好,我是 Rocky0429,一个正在学习 Python 的蒟蒻...
在学习 Python 的过程中,我为它的简洁优雅而痴迷,但它又是如此的调皮,在提供了很多舒服的功能特性之外,又悄悄挖了很多带有迷惑性的坑,令人防不胜防...
人不能两次踏入同一条河流,在无数次踩进同样的坑里之后,我觉得我有必要整理一下,一为自警,二为给大家提个醒,希望你不要和我犯相同的错误。
这会是一个系列,每篇 5 个,系列文章更新不定,不想错过的,记得点个关注,不迷路。
0x00 走丢的外部变量
首先我们先来看这么一个例子:
e = 429
try:
raise Exception()
except Exception as e:
pass
print(e)
PS:except Exception as e 可以捕获除了与程序退出(sys.exit())相关之外的所有异常。
在继续向下看之前,你可以先思考一下上述例子可能出现的结果是什么,也可以自己尝试着在编译器里输入一下。思考完了请继续往下看。
出现的结果如下:
Traceback (most recent call last):
File "test.py", line 8, in <module>
print(e)
NameError: name 'e' is not defined
竟然报错了,那么这到底是为什么呢?
其实这是因为在 Python3 中使用 as 分配异常的时候,在 except 的末尾将会把这个异常清除掉(在 Python2 中则不会出现这样的情况)。这就好像将上面的示例变成下面的样子:
e = 429
try:
raise Exception()
except Exception as e:
try:
pass
finally:
del e
print(e)
通过上面的变形代码,我们可以很清楚的看明白发生这一切的根源是什么:因为 e 被删除了。这也变相的告诉我们,如果想要在 except 后面引用 e,必须将它先赋值给其它变量。
这样看来,是变量 e 执行了 except 子句而被删除,但是为什么 e 会去执行 except 子句呢?仅仅是因为 e 和 as 后面的 e 长的一毛一样?
答案是否定的,其实这个是因为子句在 Python 中没有独立的作用域,所以上述示例中的所有内容都处于同一个作用域里,所以变量 e 会因为执行了 except 子句而被删除。
0x01 同样是加,却不一定等价
在我们来表示「加」这个概念的时候,一般我们会用两种方式:a = a + b或者是 a += b 。在很多人的概念里这两个其实就是一种,不分彼此,比如之前我就是这么认为的,直到有一天有人拿着下面的坑过来让我踩...
首先我们先来看第一个例子:
>>> a = [1,2,3]
>>> b = a
>>> a = a + [4,5,6]
一个很简单的例子,你知道此时的 a 和 b 分别是多少么?请先自己思考一下再继续向下看:
>>> a
[1, 2, 3, 4, 5, 6]
>>> b
[1, 2, 3]
估计很多人都会答对,表达式 a = a + [4,5,6] ,等号右边其实是形成了一个新的列表,最后让 a 引用了这个新的列表,而 b = a 引用的是之前的 a,所以 b 保持不变。
明白了上面的例子,我们接下来再看一个稍微有点区别的例子:
>>> a = [1,2,3]
>>> b = a
>>> a += [4,5,6]
上面的例子和文章开头的例子区别在从 + 变成了 +=,按照我们惯性思维去想,肯定以为这俩例子就是一个东西的两种不同写法而已,可实际上真的是这样吗?让我们来看一下此时的 a,b:
>>> a
[1, 2, 3, 4, 5, 6]
>>> b
[1, 2, 3, 4, 5, 6]
咦?同样是印象里的「加」,好像真的哪里有点不一样诶。。
通过上面我们就可以看出 a = a + b 和 a += b 并不总是表现相同,起码在列表上就是这么表现的。在这里的 a += [4,5,6] 实际上使用的是 extend 函数,所以 a 和 b 仍然指向已被修改的同一列表。
既然在这里说到了 + 和 +=,索性再多补充一点:在使用「加」的概念来连接字符串的时候,+= 其实比 + 的速度更快。
下面我们来实际的演示一下用 + 连接三个字符串:
>>> import timeit
>>> timeit.timeit("a = a + b + c", setup="a='a'*10000;b='b'*10000;c='c'*10000",number=100)
0.07921688999340404
>>> timeit.timeit("a += b + c", setup="a='a'*10000;b='b'*10000;c='c'*10000",number=100)
0.002059974998701364
上面的两个结果很容易看出来,在处理速度上,+= 比 + 处理的速度要快的多。出现这样现象的原因是 += 执行的是追加操作,追加操作的话就会比 + 少了一个销毁然后新建的动作,比如在 a += b + c 上 a 就不会被销毁。
0x02 不一般的小括号
很多学过别的编程语言的同学,很容易会忽略小括号 “()” 在 Python 中的一个重要表现,那就是小括号还能表示“元组” 这一不可变数据类型。
>>> type(())
<class 'tuple'>
>>> tur = (1, 2)
>>> type(tur)
<class 'tuple'>
但是如果小括号内只有一个元素的话,比如像下面这样,它就是小括号内的元素类型:
>>> tur = (1)
>>> type(tur)
<class 'int'>
>>> tur = (1, )
>>> type(tur)
<class 'tuple'>
0x03 列表的删除没有那么简单
假如我们有一个列表,我想删除列表中的元素:
>>> lst = [1, 2, 3, 4, 5]
>>> for i in lst:
... lst.remove(i)
>>> lst
[2, 4]
这是为啥子呢?是因为在 for 循环中,如果我们删除了 index = 0 (即 1)的值,原本 index = 1 及其之后的值会向前补位,所以当前 index = 1 的值为之前 index = 2 的值。
列表的删除操作我们经常要用,所以大家要打起十二分的精神来对它。
0x04 is not 不分家
is not 在 Python 中是一伙的,用的时候要靠在一起,分开以后就是两个东西,结果会不一样...
>>> [1, 2, 3] is not None
True
>>> [1, 2, 3] is (not None)
False
看完有所收获?点个在看,让更多人可以看到~谢谢啦
今天的分享就到这,拜里个拜~
◆ ◆ ◆ ◆ ◆
长按二维码关注我们
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码: