python“不为人知的”特性

Python日志

共 8250字,需浏览 17分钟

 · 2021-06-01


python“不为人知的”特性


链式比较操作

  1. >>> x = 5

  2. >>> 1 < x < 10

  3. True

  4. >>> 10 < x < 20

  5. False

  6. >>> x < 10 < x*10 < 100

  7. True

  8. >>> 10 > x <= 9

  9. True

  10. >>> 5 == x > 4

  11. True
你可能认为它执行的过程先是:1 < x ,返回 True ,然后再比较 True < 10 ,当然这么做也是返回 True ,比较表达式 True < 10 ,因为解释器会把 True 转换成1 , False 转换成 0 。但这里的链式比较解释器在内部并不是这样干的,它会把这种链式的比较操作转换成:1 < x and x < 10 ,不信你可以看看最后一个例子。这样的链式操作本可以值得所有编程语言拥有,但是很遗憾
枚举

  1. >>> a = ['a', 'b', 'c', 'd', 'e']

  2. >>> for index, item in enumerate(a): print index, item

  3. ...

  4. 0 a

  5. 1 b

  6. 2 c

  7. 3 d

  8. 4 e

  9. >>>
用enumerate包装一个可迭代对象,可以同时使用迭代项和索引,如果你不这么干的话,下面有一种比较麻烦的方法:

  1. for i in range(len(a)):

  2. print i, a[i]
enumerate 还可以接收一个可选参数start,默认start等于0。  enumerate(list, start=1)  ,这样index的起始值就是1


生成器对象

  1. x=(n for n in foo if bar(n))  #foo是可迭代对象

  2. >>> type(x)

  3. <type 'generator'>
你可以把生成器对象赋值给x,意味着可以对x进行迭代操作:


  1. for n in x:

  2. pass
它的好处就是不需要存储中间结果,也许你会使用(列表推倒式): 


  1. x = [n for n in foo if bar(n)]

  2. >>> type(x)

  3. <type 'list'>
它比生成器对象能带来更快的速度。相对地,生成器更能节省内存开销,它的值是按需生成,不需要像列表推倒式一样把整个结果保存在内存中,同时它不能重新迭代,列表推倒式则不然。 


iter()可接收callable参数
iter()内建函数接收的参数分为两种,第一种是: 

iter(collection)---> iterator
参数collection必须是可迭代对象或者是序列 ,第二种是:
iter(callable, sentinel) --> iterator
callable函数会一直被调用,直到它的返回结果等于sentinel,例如: 


  1. def seek_next_line(f):

  2. #每次读一个字符,直到出现换行符就返回

  3. for c in iter(lambda: f.read(1),'\n'):

  4. pass
小心可变的默认参数

  1. >>> def foo(x=[]):

  2. ...    x.append(1)

  3. ...    print x

  4. ...

  5. >>> foo()

  6. [1]

  7. >>> foo()

  8. [1, 1]

  9. >>> foo()

  10. [1, 1, 1]
取而代之的是你应该使用一个标记值表示“没有指定”来替换可变值,如:
 

  1. >>> def foo(x=None):

  2. ...    if x is None:

  3. ...        x = []

  4. ...    x.append(1)

  5. ...    print x

  6. >>> foo()

  7. [1]

  8. >>> foo()

  9. [1]
发送值到生成器函数在中

  1. def mygen():

  2. """Yield 5 until something else is passed back via send()"""

  3. a = 5

  4. while True:

  5. f = (yield a) #yield a and possibly get f in return

  6. if f is not None:

  7. a = f  #store the new value
你可以: 

  1. >>> g = mygen()

  2. >>> g.next()

  3. 5

  4. >>> g.next()

  5. 5

  6. >>> g.send(7)  #we send this back to the generator

  7. 7

  8. >>> g.next() #now it will yield 7 until we send something else

  9. 7
如果你不喜欢使用空格缩进,那么可以使用C语言花括号{}定义函数:

  1. >>> from __future__ import braces   #这里的braces 指的是:curly braces(花括号)

  2. File "<stdin>", line 1

  3. SyntaxError: not a chance

当然这仅仅是一个玩笑,想用花括号定义函数?没门。感兴趣的还可以了解下:

from __future__ import barry_as_FLUFL

不过这是python3里面的特性


切片操作中的步长参数

  1. a = [1,2,3,4,5]

  2. >>> a[::2]  # iterate over the whole list in 2-increments

  3. [1,3,5]
还有一个特例:  x[::-1]  ,反转列表: 

  1. >>> a[::-1]

  2. [5,4,3,2,1]
有关反转,还有两个函数reverse、reversed,reverse是list对象的方法,没有返回值,而reversed是内建方法,可接收的参数包括tuple、string、list、unicode,以及用户自定义的类型,返回一个迭代器。

  1. >>> l = range(5)

  2. >>> l

  3. [0, 1, 2, 3, 4]

  4. >>> l.reverse()

  5. >>> l

  6. [4, 3, 2, 1, 0]

  7. >>> l2 = reversed(l)

  8. >>> l2

  9. <listreverseiterator object at 0x99faeec>
装饰器
装饰器使一个函数或方法包装在另一个函数里头,可以在被包装的函数添加一些额外的功能,比如@是语法糖,它等价于:,还可以对参数、返回结果进行修改。装饰器有点类似Java中的AOP。下面这个例子是打印被装饰的函数里面的参数的装饰器,



  1. >>> def print_args(function):

  2. >>>    def wrapper(*args, **kwargs):

  3. >>>        print 'Arguments:', args, kwargs

  4. >>>        return function(*args, **kwargs)

  5. >>>    return wrapper

  6. >>> @print_args

  7. >>> def write(text):

  8. >>>    print text

  9. >>> write('foo')

  10. Arguments: ('foo',) {}

  11. foo
@是语法糖,它等价于: 

  1. >>> write = print_args(write)

  2. >>> write('foo')

  3. arguments: ('foo',) {}

  4. foo
for ... else语法

  1. for i in foo:

  2. if i == 0:

  3. break

  4. else:

  5. print("i was never 0")
else代码块只有在for循环正常结束后执行如果遇到break语句那么不会执行else语句块,等价于下面: 


  1. found = False

  2. for i in foo:

  3. if i == 0:

  4. found = True

  5. break

  6. if not found:

  7. print("i was never 0")
不过这种语法看起来怪怪地,让人感觉是else块是在for语句块没有执行的时候执行的,很容易让人去类比 if else 的语法,如果是把else换成finally或许更容易理解 

python2.5有个 __missing__ 方法

dict的子类如果定义了方法 __missing__(self, key) ,如果key不再dict中,那么d[key]就会调用 __missing__ 方法,而且d[key]的返回值就是 __missing__ 的返回值。



  1. >>> class MyDict(dict):

  2. ... def __missing__(self, key):

  3. ...  self[key] = rv = []

  4. ...  return rv

  5. ...

  6. >>> m = MyDict()

  7. >>> m["foo"].append(1)

  8. >>> m["foo"].append(2)

  9. >>> dict(m)

  10. {'foo': [1, 2]}
在collections模块下有一个叫defaultdict的dict子类,它与missing非常类似,但是对于不存在的项不需要传递参数。
 

  1. >>> from collections import defaultdict

  2. >>> m = defaultdict(list)

  3. >>> m["foo"].append(1)

  4. >>> m["foo"].append(2)

  5. >>> dict(m)

  6. {'foo': [1, 2]}
变量值交换

  1. >>> a = 10

  2. >>> b = 5

  3. >>> a, b

  4. (10, 5)

  5. >>> a, b = b, a

  6. >>> a, b

  7. (5, 10)
等号右边是一个创建元组的表达式,等号左边解压(没有引用的)元组分别赋给名称(变量)a和b。赋完值后因为没有被其他名字引用,因此被标记之后被垃圾收集器回收,而绑定到a和b的值已经被交换了。注意:多值赋值其实仅仅就是元组打包和序列解包的组合的过程


可读的正则表达式
在Python中你可以把正则表达式分割成多行写,还可以写注释



  1. >>> pattern = """

  2. ... ^                   # beginning of string

  3. ... M{0,4}              # thousands - 0 to 4 M's

  4. ... (CM|CD|D?C{0,3})    # hundreds - 900 (CM), 400 (CD), 0-300 (0 to 3 C's),

  5. ...                    #            or 500-800 (D, followed by 0 to 3 C's)

  6. ... (XC|XL|L?X{0,3})    # tens - 90 (XC), 40 (XL), 0-30 (0 to 3 X's),

  7. ...                    #        or 50-80 (L, followed by 0 to 3 X's)

  8. ... (IX|IV|V?I{0,3})    # ones - 9 (IX), 4 (IV), 0-3 (0 to 3 I's),

  9. ...                    #        or 5-8 (V, followed by 0 to 3 I's)

  10. ... $                   # end of string

  11. ... """

  12. >>> re.search(pattern, 'M', re.VERBOSE)
函数参数解包(unpacking)
分别使用 * 和 ** 解包列表和字典,这是一种非常实用的快捷方式,因为list,tuple,dict作为容器被广泛使用



  1. def draw_point(x, y):

  2. # do some magic

  3. point_foo = (3, 4)

  4. point_bar = {'y': 3, 'x': 2}

  5. draw_point(*point_foo)

  6. draw_point(**point_bar)
动态地创建新类型
动态创建新类型虽不是实用功能,但了解一下也是有好处的



  1. >>> NewType = type("NewType", (object,), {"x": "hello"})

  2. >>> n = NewType()

  3. >>> n.x

  4. "hello"
type的第一个参数就是类名,第二个参数是继承的父类,第三个参数是类的属性.它完全等同于: 


  1. >>> class NewType(object):

  2. >>>    x = "hello"

  3. >>> n = NewType()

  4. >>> n.x

  5. "hello"
上下文管理器与with语句
上下文管理器(context manager)用于规定某个对象的使用范围,进入或退出该范围时,特殊的操作会被执行(比如关闭连接,释放内存等等),语法是: with... as ... ,该特性在python2.5引入的. 上下文管理器协议有两个方法组成contextmanager.__enter__() 和 contextmanager.__exit__() ,任何实现了这两个方法的对象都称之为上下文管理器对象,比如文件对象就默认实现了该协议.



  1. with open('foo.txt', 'w') as f:

  2. f.write('hello!')
字典的get()方法
字典的get()方法用来替换d['key'],后者如果是遇到key不存在会有异常,如果使用的d.get('key'),key不存在时它返回的是None,你可以指定两个参数如:d.get('key',0)来用0取代返回的None


sum[value] = sum.get(value, 0) + 1
还有一个类似的方法  setdefault(key, value)  ,如果字典中存在key,那么就直接返回d[key],否则设置d[key]=value,并返回该值.

  1. >>> d = {'key':123}

  2. >>> d.setdefault('key',456)

  3. 123

  4. >>> d['key']

  5. 123

  6. >>> d.setdefault('key2',456)

  7. 456

  8. >>> d['key2']

  9. 456
collections.Counter是dict的子类,用来统计可哈稀对象, 


  1. >>> cnt = Counter('helloworld')

  2. >>> cnt

  3. Counter({'l': 3, 'o': 2, 'e': 1, 'd': 1, 'h': 1, 'r': 1, 'w': 1})

  4. >>> cnt['l']

  5. 3

  6. >>> cnt['x'] = 10

  7. >>> cnt.get('y')
描述符(Descriptors)
描述符是python的核心特新之一,当你使用 . 访问成员时,(如:x.y),python首先在实例字典中查找该成员,如果没有发现再从类字典中查找,如果这个对象实现了描述符(实现了 __get__,__set__,__delete__ ),那么优先返回 __get__ 方法的返回值.


条件赋值
为什么python中没有类c语言的三目运算符,Guido van Rossum说过了,条件赋值更容易理解


x = 3 if (y == 1) else 2
这个表达式的意思就是:如果y等于那么就把3赋值给x,否则把2赋值给x, 条件中的括号是可选的,为了可读性可以考虑加上去.if else中的表达式可以是任何类型的,既可以函数,还可以类 

(func1 if y == 1 else func2)(arg1, arg2)
如果y等于1,那么调用func1(arg1,arg2)否则调用func2(arg1,arg2) 
x = (class1 if y == 1 else class2)(arg1, arg2)

class1,class2是两个类

异常else语句块

  1. try:

  2. try_this(whatever)

  3. except SomeException, exception:

  4. #Handle exception

  5. else:

  6. # do something

  7. finally:

  8. #do something
else语句块会在没有异常的情况下执行,先于finally,它的好处就是你可以明确知道它会在没有异常的情况下执行,如果是把else语句块放在try语句块里面就达不到这种效果.
一键三连~~

有一种奋斗叫更新
记得关注小编哟



浏览 17
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报