Python六酷技巧 | 原来Python还能这样用-技术圈

本文含 6318 字，4 图表截屏

建议阅读 32 分钟

引言

不管学什么，我个人是非常喜欢小技巧（tricks）的，Python 也不例外。著名 Python 技巧大师 Dan Bader 是这样定义 Python Tricks 的。

A Python Trick either teaches an aspect of Python with a simple illustration, or it serves as a motivating example, enabling you to dig deeper and develop an intuitive understanding.
Dan Bader

Python Trick 表明简单而直观，但可以激发你继续深挖的兴趣，你会说“原来还可以这样做啊”。本帖就介绍几个我最喜欢的 Trick，使用它们可以让你的代码更 Pythonic。

本帖介绍六种技巧：

下划线占位符
枚举
打包
解包
动态属性
密码函数

它们都非常直观而简单，相信读完之后，肯定有几个技巧会让你惊叹到，原来 Python 还可以这么用。

下划线占位符

有时候数字一大，数起来会犯迷糊，看下例。

apple_mktcap = 1084000000000facebook_mktcap = 458870000000total = apple_mktcap + facebook_mktcapprint(total)

1542870000000.0

这个苹果和脸书的市值之和有多少个零啊？数不清楚是吧，在 Python 中，我们可以用下划线占位符（underscore placeholder）来将大数每三位数分段。请注意，多加了下划线，数字还是数值型变量，只是让我们容易辨认大数。

apple_mktcap = 1_084_000_000_000facebook_mktcap = 458_870_000_000total = apple_mktcap + facebook_mktcapprint(total)

1542870000000

你看，加个下划线的数字还是可以相加，但是结果还是不好认。还记得 f string 格式化字符串吗？用 :, 来每三位数分段。

print(f'Total is {total:,} USD')

Total is 1,542,870,000,000 USD

“下划线占位符”解决痛点：容易辨认大数的位数。

枚举

给定一列表，包含四种计算机语言的元素。

languages = ['Python', 'R', 'Matlab', 'Julia']

如果我们想把每中语言附加对应的索引一来打印出来，怎么写代码呢？最直接的想法就是初始化 index 为 0，然后在运行每个 for 循环后将 index 的值加 1，代码如下。

index = 0for lang in languages:    print(index, lang)    index +=1

0 Python
1 R
2 Matlab
3 Julia

结果是对的，但是这代码你不觉得很丑吗？很不 Pythonic 吗？

Python 有 enumerate() 函数可以一次性返回列表（任意迭代器）的元素以及其对应的索引，代码如下，优雅吗？

for index, lang in enumerate(languages):    print(index, lang)

0 Python
1 R
2 Matlab
3 Julia

除此之外，你还可以自定义索引的初始值。在实际生活中，一般索引从 1 开始更自然，那么将参数 start 设置为 1 就好了。

for index, lang in enumerate(languages, start=1):    print(index, lang)

1 Python
2 R
3 Matlab
4 Julia

“枚举函数 enumerate()”解决痛点：不需要显性创建索引。

打包

给定一串名字（names）和演员角色（actors），用两个列表存储。

names = ['小罗伯特唐尼', '托比·马奎尔', '克里斯蒂安·贝尔', '杰森·莫玛']actors = ['钢铁侠', '蜘蛛侠', '蝙蝠侠', '水行侠']

如果我们想把每个名字和角色一一对应起来，可以用上节学到的 enumerate() 函数。我们可以返回 names 里的元素和索引，再用索引来获取 actors 里的元素，代码如下。

for index, name in enumerate(names):    print(f'{name}是{actors[index]}')

小罗伯特唐尼是钢铁侠
托比·马奎尔是蜘蛛侠
克里斯蒂安·贝尔是蝙蝠侠
杰森·莫玛是水行侠

结果是对的，但是代码不够优雅。来，zip() 函数了解一下？

for name, actor in zip(names, actors):    print(f'{name}是{actor}')

小罗伯特唐尼是钢铁侠
托比·马奎尔是蜘蛛侠
克里斯蒂安·贝尔是蝙蝠侠
杰森·莫玛是水行侠

zip() 函数将列表（迭代器）中对应的元素打包成一个个元组，然后返回由这些元组组成的列表。上面代码是不是漂亮多了。

再加一个列表如何？zip() 函数表示毫无压力。

universes = ['漫威', '漫威', 'DC', 'DC']

for name, actor, universe in zip(names, actors, universes):    print(f'{name}是来自{universe}的{actor}')

小罗伯特唐尼是来自漫威的钢铁侠
托比·马奎尔是来自漫威的蜘蛛侠
克里斯蒂安·贝尔是来自DC的蝙蝠侠
杰森·莫玛是来自DC的水行侠

让我们再看一次 zip() 函数的用法，其 3 个参数 names, actors 和 universes 列表中都有 4 个元素，那么在对应的位置 i（从 0 到 3）一个个获取 names[i], actors[i] 和 universes[i]，并打包成新列表，因此输出是 4 个列表，每个列表有 3 个元素。

a = zip(names, actors, universes)print(*a)

('小罗伯特唐尼', '钢铁侠', '漫威')
('托比·马奎尔', '蜘蛛侠', '漫威')
('克里斯蒂安·贝尔', '蝙蝠侠', 'DC')
('杰森·莫玛', '水行侠', 'DC')

结果没问题。需要注意的是 a 实际上是个对象，要看它里面的内容，需要在 a 前面加个 * 字符。

你们现在肯定会想，有了 zip()，那有没有其反向操作的 unzip() 呢？答案是没有，zip() 的反向操作还是 .... zip()!!!

你品，你细品。

a = zip(names, actors, universes)names, actors, universes = zip(*a)print(names, actors, universes)

('小罗伯特唐尼', '托比·马奎尔', '克里斯蒂安·贝尔', '杰森·莫玛')
('钢铁侠', '蜘蛛侠', '蝙蝠侠', '水行侠')
('漫威', '漫威', 'DC', 'DC')

“打包函数 zip()”解决痛点：能同时遍历多个迭代器。

解包

一个简单例子，将 1 和 2 分别赋给 a 和 b，这种操作称为解包（unpack）。

a, b = 1, 2print(a)print(b)

1
2

如果你不想要 b 的话，用下划线代替就行了。

a, _ = 1, 2print(a)

但如果等号左右两边元素和变量个数不一样。程序会报错。

a, b, c = 1, 2

---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
input-77-9dbc59cfd6c6> in <module>
----> 1 a, b, c = 1, 2

ValueError: not enough values to unpack (expected 3, got 2)

用 * 字符可以解决这个问题。将右边的 1 和 2 分别解包给 a 和 b，那么什么都不剩了，因此 c 得到的是个空集 []。

a, b, *c = 1, 2print(a)print(b)print(c)

1
2
[]

如果右边元素多过左边变量呢？从头开始一一解包，再把多余的全部赋给 c。

a, b, *c = 1, 2, 3, 4, 5print(a)print(b)print(c)

1
2
[3, 4, 5]

更进一步，我们还可以从头和尾开始一一解包，再把多余的全部赋给 c。

a, b, *c, d = 1, 2, 3, 4, 5print(a)print(b)print(c)print(d)

1
2
[3, 4]
5

不想要 c 的话，用 *_ 将其代替即可。

a, b, *_, d = 1, 2, 3, 4, 5print(a)print(b)print(d)

1
2
5

“解包”解决痛点：将值赋给正确的变量。

动态属性

这个技巧是我觉得最有用的。首先定一个金融产品的类 Instrument，并创建一个对象 inst。

class Instrument():    pass
inst = Instrument()

定义 inst 的两个属性并赋值，本金（notional）和到期日（maturity）。

inst.notional = 100_000_000inst.maturity = '2025-03-25'

print(inst.notional)print(inst.maturity)

100000000
2025-03-25

现在将属性 notional 和其属性值 10000000 存储在变量 first_key 和 first_val 中。

first_key = 'notional'first_val = 100_000_000

我们想用 first_key 的值 notional（而不是 first_key 这个字符）来作为属性。

inst = Instrument()inst.first_key = first_val

打印 inst.notional 会报错，错误是 Instrument 对象中没有 notional 这样的属性名。

print(inst.notional)

---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
input-99-50eeb1451324> in <module>
----> 1 print(inst.notional)

AttributeError: 'Instrument' object has no attribute 'notional'

原因是 inst 把 first_key 这个字符串当成属性名，验证如下。

print(inst.first_key)

100000000

怎么解决这个动态属性的问题呢？即我们要变量的值为属性名，而不是变量本身名称当属性名。用 setattr() 函数，它有三个参数：

参数 1 - 对象
参数 2 - 属性名的变量名
参数 3 - 属性值的变量名

代码如下，这时用 inst.notional 不会报错了。

inst = Instrument()setattr(inst, first_key, first_val)print(inst.notional)

100000000

和 setattr() 相对应，你可以用 getattr() 函数来获取属性值，它有两个参数：

参数 1 - 对象
参数 2 - 属性名的变量名

代码如下：

getattr(inst, first_key)

100000000

和静态属性相比，动态属性到底好在哪里呢？以读取欧式期权的特征举例，通常信息以字典（也有其他格式）存储，具体内容如下：

inst_info = {'ID':'9001001',              'Effective Date':'2020-03-20',              'Maturity Date':'2020-06-20',             'Notional':10_000_000,             'Domestic Currency':'USD',             'Foreign Currency':'EUR',             'Flavor':'Put',             'Strike':1.08,             'Display':'domestic pips',             'Asset Class':'FX',             'Ins trument Type':'European Option',             'Model':'Heston'}

那么当我们创建 inst 对象时，把上面字典的键（key）作为属性名。每种产品具体的特征都不一样，如果用静态属性的将字典转成对象的话，代码会非常乱而且无法管理，但如果用动态属性的话，下面三行代码就能搞定（用 setattr()）。

inst = Instrument()for key, val in inst_info.items():    setattr(inst, key, val)

用 getattr() 函数来打印出来看结果对不对，两行代码搞定。

for key in inst_info.keys():    print( key, '|', getattr(inst, key))

ID | 9001001
Effective Date | 2020-03-20
Maturity Date | 2020-06-20
Notional | 10000000
Domestic Currency | USD
Foreign Currency | EUR
Flavor | Put
Strike | 1.08
Display | domestic pips
Asset Class | FX
Instrument Type | European Option
Model | Heston

结果是对的，但也是丑的，用 f string 来添加若干个空白，将每个属性值的起始位置对齐。

for key in inst_info.keys():    print( f'{key:18s}|', getattr(inst, key))

ID | 9001001
Effective Date | 2020-03-20
Maturity Date | 2020-06-20
Notional | 10000000
Domestic Currency | USD
Foreign Currency | EUR
Flavor | Put
Strike | 1.08
Display | domestic pips
Asset Class | FX
Instrument Type | European Option
Model | Heston

“动态属性 setattr()”解决痛点：用尽可能少的代码快速创建对象。

密码函数

当登录时，你需要输入你的用户名和密码，用 input() 函数可以做到要求用户主动输入，但是输入的密码任何人都可见，这还是密码吗？

username = input('Username: ')password = input('Password: ')print('Logging In...')

Username: Steven
Password: 1031
Logging In ...

用 getpass() 函数即可，不解释，自己看下图。

from getpass import getpassusername = input('Username: ')password = getpass('Password: ')print('Logging In...')

Username: Steven
Password: ········
Logging In ...

“密码函数 getpass()”解决痛点：让输入的密码不可见。

总结

六个小技巧，简单直观，但是超级有用。有时候就是用这样的一个函数，你不知道，写出来的代码不优雅，你知道了，写出来的代码真好看。

六个技巧总结如下：

下划线占位符：容易辨认大数的位数
枚举函数 enumerate()：不需要显性创建索引
打包函数 zip()：能同时遍历多个迭代器
解包：将值赋给正确的变量
动态属性 setattr()：用尽可能少的代码快速创建对象
密码函数 getpass()：让输入的密码不可见

用起来，酷起来。

Stay Tuned！