完结了!
这个系列反响还不错,所以一口气把 collections 模块下面几个类都写完了。这篇算完结篇,希望对你有帮助。
Counter
Counter 也是 dict 的子类,dict 有的特性它都有,正如其名,它的主要作用是用于统计计数。
比如统计一个字符串中每个单词出现的次数,统计一个列表中每个元素出现的次数等等。凡是需要计数的场景都可以用Counter来实现。
例如我要统计字符串”hello world” 中每个单词的出现次数时,用字典来实现可以这样。
>>> c = dict()
>>> for s in "helloworld":
... c[s] = c.setdefault(s, 0) + 1
>>> c
{'h': 1, 'e': 1, 'l': 3, 'o': 2, 'w': 1, 'r': 1, 'd': 1}
如果使用 Counter,就更简单了,直接将字符串作为参数传进去就好。
>>> from collections import Counter
>>> c = Counter("helloworld")
>>> c
Counter({'l': 3, 'o': 2, 'h': 1, 'e': 1, 'w': 1, 'r': 1, 'd': 1})
Counter 还有一个比较实用的方法是 Counter.most_common(n), 它可以返回前n个出现次数最多的元素
>>> c.most_common(1) # 出现次数最多的前1位
[('l', 3)]
>>> c.most_common(2) # 出现次数最多的前2位
[('l', 3), ('o', 2)]
>>> c.most_common(3) # 出现次数最多的前3位
[('l', 3), ('o', 2), ('h', 1)]
>>>
这个在统计排行时有用,不过在大型应用中,如果数据是保存在数据库的,这种操作其实在数据库来实现就行,没必要用Python来处理。
OrderedDict
OrderedDict 同样是 dict 的子类,它是一个有序的字典,在Python3.6以前,字典元素并不保证有序,所以就有OrderedDict。
>>> from collections import OrderedDict
>>> od = OrderedDict()
>>> od['a'] = 1
>>> od['b'] = 2
>>> od['c'] = 3
>>> od
OrderedDict([('a', 1), ('b', 2), ('c', 3)])
所谓有序不是按照大小来排,而是按照key的加入顺序排列,a 最先加入,所以排在前面。但是,从Python3.7开始,dict 本身也拥有了这种特性,例如:
>>> d = dict()
>>> d['a'] = 1
>>> d['b'] = 2
>>> d['c'] = 3
>>> d
{'a': 1, 'b': 2, 'c': 3}
默认按照插入的顺序排的,所以,从Python3.7开始,OrderedDict的用处就并不大了,因为 dict 已经实现了有序这个特性。
关注我,每天分享实用小知识
评论