Python六酷技巧 | 原来Python还能这样用
不管学什么,我个人是非常喜欢小技巧(tricks)的,Python 也不例外。著名 Python 技巧大师 Dan Bader 是这样定义 Python Tricks 的。
A Python Trick either teaches an aspect of Python with a simple illustration, or it serves as a motivating example, enabling you to dig deeper and develop an intuitive understanding.
Dan Bader
Python Trick 表明简单而直观,但可以激发你继续深挖的兴趣,你会说“原来还可以这样做啊”。本帖就介绍几个我最喜欢的 Trick,使用它们可以让你的代码更 Pythonic。
本帖介绍六种技巧:
下划线占位符
枚举
打包
解包
动态属性
密码函数
它们都非常直观而简单,相信读完之后,肯定有几个技巧会让你惊叹到,原来 Python 还可以这么用。
有时候数字一大,数起来会犯迷糊,看下例。
apple_mktcap = 1084000000000
facebook_mktcap = 458870000000
total = apple_mktcap + facebook_mktcap
print(total)
1542870000000.0
这个苹果和脸书的市值之和有多少个零啊?数不清楚是吧,在 Python 中,我们可以用下划线占位符(underscore placeholder)来将大数每三位数分段。请注意,多加了下划线,数字还是数值型变量,只是让我们容易辨认大数。
apple_mktcap = 1_084_000_000_000
facebook_mktcap = 458_870_000_000
total = apple_mktcap + facebook_mktcap
print(total)
1542870000000
你看,加个下划线的数字还是可以相加,但是结果还是不好认。还记得 f string 格式化字符串吗?用 :, 来每三位数分段。
print(f'Total is {total:,} USD')
Total is 1,542,870,000,000 USD
“下划线占位符”解决痛点:容易辨认大数的位数。
给定一列表,包含四种计算机语言的元素。
languages = ['Python', 'R', 'Matlab', 'Julia']
如果我们想把每中语言附加对应的索引一来打印出来,怎么写代码呢?最直接的想法就是初始化 index 为 0,然后在运行每个 for 循环后将 index 的值加 1,代码如下。
index = 0
for lang in languages:
print(index, lang)
index +=1
0 Python
1 R
2 Matlab
3 Julia
结果是对的,但是这代码你不觉得很丑吗?很不 Pythonic 吗?
Python 有 enumerate() 函数可以一次性返回列表(任意迭代器)的元素以及其对应的索引,代码如下,优雅吗?
for index, lang in enumerate(languages):
print(index, lang)
0 Python
1 R
2 Matlab
3 Julia
除此之外,你还可以自定义索引的初始值。在实际生活中,一般索引从 1 开始更自然,那么将参数 start 设置为 1 就好了。
for index, lang in enumerate(languages, start=1):
print(index, lang)
1 Python
2 R
3 Matlab
4 Julia
“枚举函数 enumerate()”解决痛点:不需要显性创建索引。
给定一串名字(names)和演员角色(actors),用两个列表存储。
names = ['小罗伯特唐尼', '托比·马奎尔', '克里斯蒂安·贝尔', '杰森·莫玛']
actors = ['钢铁侠', '蜘蛛侠', '蝙蝠侠', '水行侠']
如果我们想把每个名字和角色一一对应起来,可以用上节学到的 enumerate() 函数。我们可以返回 names 里的元素和索引,再用索引来获取 actors 里的元素,代码如下。
for index, name in enumerate(names):
print(f'{name}是{actors[index]}')
小罗伯特唐尼是钢铁侠
托比·马奎尔是蜘蛛侠
克里斯蒂安·贝尔是蝙蝠侠
杰森·莫玛是水行侠
结果是对的,但是代码不够优雅。来,zip() 函数了解一下?
for name, actor in zip(names, actors):
print(f'{name}是{actor}')
小罗伯特唐尼是钢铁侠
托比·马奎尔是蜘蛛侠
克里斯蒂安·贝尔是蝙蝠侠
杰森·莫玛是水行侠
zip() 函数将列表(迭代器)中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。上面代码是不是漂亮多了。
再加一个列表如何?zip() 函数表示毫无压力。
universes = ['漫威', '漫威', 'DC', 'DC']
for name, actor, universe in zip(names, actors, universes):
print(f'{name}是来自{universe}的{actor}')
小罗伯特唐尼是来自漫威的钢铁侠
托比·马奎尔是来自漫威的蜘蛛侠
克里斯蒂安·贝尔是来自DC的蝙蝠侠
杰森·莫玛是来自DC的水行侠
让我们再看一次 zip() 函数的用法,其 3 个参数 names, actors 和 universes 列表中都有 4 个元素,那么在对应的位置 i(从 0 到 3)一个个获取 names[i], actors[i] 和 universes[i],并打包成新列表,因此输出是 4 个列表,每个列表有 3 个元素。
a = zip(names, actors, universes)
print(*a)
('小罗伯特唐尼', '钢铁侠', '漫威')
('托比·马奎尔', '蜘蛛侠', '漫威')
('克里斯蒂安·贝尔', '蝙蝠侠', 'DC')
('杰森·莫玛', '水行侠', 'DC')
结果没问题。需要注意的是 a 实际上是个对象,要看它里面的内容,需要在 a 前面加个 * 字符。
你们现在肯定会想,有了 zip(),那有没有其反向操作的 unzip() 呢?答案是没有,zip() 的反向操作还是 .... zip()!!!
你品,你细品。
a = zip(names, actors, universes)
names, actors, universes = zip(*a)
print(names, actors, universes)
('小罗伯特唐尼', '托比·马奎尔', '克里斯蒂安·贝尔', '杰森·莫玛')
('钢铁侠', '蜘蛛侠', '蝙蝠侠', '水行侠')
('漫威', '漫威', 'DC', 'DC')
“打包函数 zip()”解决痛点:能同时遍历多个迭代器。
一个简单例子,将 1 和 2 分别赋给 a 和 b,这种操作称为解包(unpack)。
a, b = 1, 2
print(a)
print(b)
1
2
如果你不想要 b 的话,用下划线代替就行了。
a, _ = 1, 2
print(a)
1
但如果等号左右两边元素和变量个数不一样。程序会报错。
a, b, c = 1, 2
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
input-77-9dbc59cfd6c6> in <module>
----> 1 a, b, c = 1, 2
ValueError: not enough values to unpack (expected 3, got 2)
用 * 字符可以解决这个问题。将右边的 1 和 2 分别解包给 a 和 b,那么什么都不剩了,因此 c 得到的是个空集 []。
a, b, *c = 1, 2
print(a)
print(b)
print(c)
1
2
[]
如果右边元素多过左边变量呢?从头开始一一解包,再把多余的全部赋给 c。
a, b, *c = 1, 2, 3, 4, 5
print(a)
print(b)
print(c)
1
2
[3, 4, 5]
更进一步,我们还可以从头和尾开始一一解包,再把多余的全部赋给 c。
a, b, *c, d = 1, 2, 3, 4, 5
print(a)
print(b)
print(c)
print(d)
1
2
[3, 4]
5
不想要 c 的话,用 *_ 将其代替即可。
a, b, *_, d = 1, 2, 3, 4, 5
print(a)
print(b)
print(d)
1
2
5
“解包”解决痛点:将值赋给正确的变量。
这个技巧是我觉得最有用的。首先定一个金融产品的类 Instrument,并创建一个对象 inst。
class Instrument():
pass
inst = Instrument()
定义 inst 的两个属性并赋值,本金(notional)和到期日(maturity)。
inst.notional = 100_000_000
inst.maturity = '2025-03-25'
print(inst.notional)
print(inst.maturity)
100000000
2025-03-25
现在将属性 notional 和其属性值 10000000 存储在变量 first_key 和 first_val 中。
first_key = 'notional'
first_val = 100_000_000
我们想用 first_key 的值 notional(而不是 first_key 这个字符)来作为属性。
inst = Instrument()
inst.first_key = first_val
打印 inst.notional 会报错,错误是 Instrument 对象中没有 notional 这样的属性名。
print(inst.notional)
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
input-99-50eeb1451324> in <module>
----> 1 print(inst.notional)
AttributeError: 'Instrument' object has no attribute 'notional'
原因是 inst 把 first_key 这个字符串当成属性名,验证如下。
print(inst.first_key)
100000000
怎么解决这个动态属性的问题呢?即我们要变量的值为属性名,而不是变量本身名称当属性名。用 setattr() 函数,它有三个参数:
参数 1 - 对象
参数 2 - 属性名的变量名
参数 3 - 属性值的变量名
代码如下,这时用 inst.notional 不会报错了。
inst = Instrument()
setattr(inst, first_key, first_val)
print(inst.notional)
100000000
和 setattr() 相对应,你可以用 getattr() 函数来获取属性值,它有两个参数:
参数 1 - 对象
参数 2 - 属性名的变量名
代码如下:
getattr(inst, first_key)
100000000
和静态属性相比,动态属性到底好在哪里呢?以读取欧式期权的特征举例,通常信息以字典(也有其他格式)存储,具体内容如下:
inst_info = {'ID':'9001001',
'Effective Date':'2020-03-20',
'Maturity Date':'2020-06-20',
'Notional':10_000_000,
'Domestic Currency':'USD',
'Foreign Currency':'EUR',
'Flavor':'Put',
'Strike':1.08,
'Display':'domestic pips',
'Asset Class':'FX',
'Ins trument Type':'European Option',
'Model':'Heston'}
那么当我们创建 inst 对象时,把上面字典的键(key)作为属性名。每种产品具体的特征都不一样,如果用静态属性的将字典转成对象的话,代码会非常乱而且无法管理,但如果用动态属性的话,下面三行代码就能搞定(用 setattr())。
inst = Instrument()
for key, val in inst_info.items():
setattr(inst, key, val)
用 getattr() 函数来打印出来看结果对不对,两行代码搞定。
for key in inst_info.keys():
print( key, '|', getattr(inst, key))
ID | 9001001
Effective Date | 2020-03-20
Maturity Date | 2020-06-20
Notional | 10000000
Domestic Currency | USD
Foreign Currency | EUR
Flavor | Put
Strike | 1.08
Display | domestic pips
Asset Class | FX
Instrument Type | European Option
Model | Heston
结果是对的,但也是丑的,用 f string 来添加若干个空白,将每个属性值的起始位置对齐。
for key in inst_info.keys():
print( f'{key:18s}|', getattr(inst, key))
ID | 9001001
Effective Date | 2020-03-20
Maturity Date | 2020-06-20
Notional | 10000000
Domestic Currency | USD
Foreign Currency | EUR
Flavor | Put
Strike | 1.08
Display | domestic pips
Asset Class | FX
Instrument Type | European Option
Model | Heston
“动态属性 setattr()”解决痛点:用尽可能少的代码快速创建对象。
当登录时,你需要输入你的用户名和密码,用 input() 函数可以做到要求用户主动输入,但是输入的密码任何人都可见,这还是密码吗?
username = input('Username: ')
password = input('Password: ')
print('Logging In...')
Username: Steven
Password: 1031
Logging In ...
用 getpass() 函数即可,不解释,自己看下图。
from getpass import getpass
username = input('Username: ')
password = getpass('Password: ')
print('Logging In...')
Username: Steven
Password: ········
Logging In ...
“密码函数 getpass()”解决痛点:让输入的密码不可见。
六个小技巧,简单直观,但是超级有用。有时候就是用这样的一个函数,你不知道,写出来的代码不优雅,你知道了,写出来的代码真好看。
六个技巧总结如下:
下划线占位符:容易辨认大数的位数
枚举函数 enumerate():不需要显性创建索引
打包函数 zip():能同时遍历多个迭代器
解包:将值赋给正确的变量
动态属性 setattr():用尽可能少的代码快速创建对象
密码函数 getpass():让输入的密码不可见
用起来,酷起来。
Stay Tuned!