Python 中让你相见恨晚的 20 个骚操作

俊红的数据分析之路

共 4923字,需浏览 10分钟

 · 2021-12-18

今天和大家分享 20 个 Python 编程中新手必会的“骚操作”,使用的频率超高!记得点赞,收藏哦!话不多说,进入正题!

1.列表推导式

使用列表推导式创建一个列表。

>>> [n*10 for n in range(5)]
[010203040]

2.交换变量

一行代码交换两个变量的值。

>>> m, n = 12
>>> m, n = n, m
>>> m
2
>>> n
1

3.连续比较

链式比较操作符。

>>> m, n = 3'c'
>>> 1 < m < 5
True
>>> 'd' < n < 'f'
False

4.序列切片

通过切片快速获取序列片段。

>>> lst = [12345]
>>> lst[:3]  # 取前三个数
[123]
>>> lst[::-1]  # 逆序
[54321]
>>> lst[::2]  # 步长为2
[135]
>>> lst[::-2]  # 逆序步长为2
[531]

5.切片快速增删序列

通过切片替换序列片段的值。

>>> lst = [12345]
>>> lst[1:3] = []
>>> lst
[145]
>>> lst[1:3] = ['a''b''c''d']
>>> lst
[1'a''b''c''d']

6.%timeit 计算运行时间

计算 10000 次列表推导式创建列表所用时间。

%timeit -n 10000 [n for n in range(5)]

# 2.41 µs ± 511 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

7.三元表达式

获取 m,n 中较大的值。

>>> m = 4
>>> n = 2
>>> if m > n:
        print('m')
else:
        print('n')

m
>>> 'm' if m > n else 'n'
'm'

还有一种比较少见的写法。

>>> m = 4
>>> n = 2
>>> ("n""m")[m > n]
'm'

格式:(, )[condition]

8.解包(unpack)

可迭代对象都支持解包。

>>> a, b, *c = [1234]
>>> a
1
>>> b
2
>>> c
[34]
>>> print(*range(3))
0 1 2

9.lambda 匿名函数

lambda 函数可以接收任意多个参数 (包括可选参数) ,返回单个表达式值。 lambda 函数不能包含命令,只能包含一个表达式。

>>> def func(x, y):
 return x * y

>>> func(23)
6
>>> func = lambda x, y: x * y
>>> func(23)
6

10.map 序列映射

对序列中每一个元素调用指定函数,返回迭代器。

>>> def func(x):
       return x ** 2

>>> list(map(func, [1,2,3]))
[149]

使用 lambda 表达式。

>>> list(map(lambda x: x ** 2, [123]))
[149]

11.filter 过滤序列

过滤掉不符合条件的元素,返回迭代器。

>>> def func(x): 
       return x % 3 == 0
  
>>> list(filter(func, [12 ,3]))
[3]

使用 lambda 表达式。

>>> list(filter(lambda x: x % 3 == 0, [123]))
[3]

12.获取序列组合

获取两个序列每个元素两两组合的结果。

>>> list1 = ['a''b']
>>> list2 = ['1''2']
>>> [(m, n) for m in list1 for n in list2]
[('a''1'), ('a''2'), ('b''1'), ('b''2')]
>>> from itertools import product
>>> list(product(list1, list2))
[('a''1'), ('a''2'), ('b''1'), ('b''2')]

13.随机选取序列元素

随机选取序列中的一个元素。

>>> from random import choice
>>> lst = [1234]
>>> choice(lst)
3

随机选取序列中的多个元素(可重复)。k 值指定数量。

>>> from random import choices
>>> lst = [1234]
>>> choices(lst, k=3)
[434]

随机选取序列中的多个元素(不重复)。k 值指定数量。

>>> from random import sample
>>> lst = [1234]
>>> sample(lst, k=3)
[432]

14.序列元素计数

统计序列每个元素出现的次数。

>>> from collections import Counter
>>> s = 'python+py'
>>> counter = Counter(s)
>>> counter
Counter({'p'2'y'2't'1'h'1'o'1'n'1'+'1})

返回的结果类似字典,可以使用字典的相关方法。

>>> counter.keys()
dict_keys(['p''y''t''h''o''n''+'])
>>> counter.values()
dict_values([2211111])
>>> counter.items()
dict_items([('p'2), ('y'2), ('t'1), ('h'1), ('o'1), ('n'1), ('+'1)])

统计出现次数最多的两个元素。

>>> counter.most_common(2)
[('p'2), ('y'2)]

15.字典排序

字典按照键(key)降序排序。

>>> dic = {'d'2'c'1'a'3'b'4}
>>> sort_by_key = sorted(dic.items(), key=lambda x: x[0], reverse=False)
>>> {key: value for key, value in sort_by_key}
{'a'3'b'4'c'1'd'2}

字典按照值(value)降序排序。

>>> dic = {'d'2'c'1'a'3'b'4}
>>> sort_by_value = sorted(dic.items(), key=lambda x: x[1], reverse=False)
>>> {key: value for key, value in sort_by_value}
{'c'1'd'2'a'3'b'4}

16.字典合并

>>> dict1 = {'name''静香''age'18}
>>> dict2 = {'name''静香''sex''female'}
  1. update() 更新字典。
>>> dict1.update(dict2)
>>> dict1
{'name''静香''age'18'sex''female'}
  1. 字典推导式
>>> {k: v for dic in [dict1, dict2] for k, v in dic.items()}
{'name''静香''age'18'sex''female'}
  1. 元素拼接
>>> dict(list(dict1.items()) + list(dict2.items()))
{'name''静香''age'18'sex''female'}
  1. chain() 可以将序列连接,返回可迭代对象。
from itertools import chain
>>> dict(chain(dict1.items(), dict2.items()))
{'name''静香''age'18'sex''female'}
  1. collections.ChainMap 可以将多个字典或映射,并将它们合并。
>>> from collections import ChainMap
>>> dict(ChainMap(dict2, dict1))
{'name''静香''age'18'sex''female'}
  1. Python3.5 以上的版本中,可以通过字典解包进行合并。
>>> {**dict1, **dict2}
{'name''静香''age'18'sex''female'}

17.zip 打包

zip() 将序列中对应的元素打包成一个个的元组,然后返回由这些元组组成的迭代器。

如果序列的元素个数不一致,则返回列表长度与最短的对象相同。

>>> list1 = [123]
>>> list2 = [456]
>>> list3 = ['a''b''c''d']
>>> res = zip(list1, list2)
>>> res
0x0000013C13F62200>
>>> list(res)
[(14), (25), (36)]
>>> list(zip(list2, list3))
[(4'a'), (5'b'), (6'c')]

18.enumerate 遍历

enumerate 函数可以将可迭代对象组合成一个索引序列,这样遍历时就可以同时获取索引与对应的值。

>>> lst = ['a''b''c']
>>> for index, char in enumerate(lst):
 print(index, char)

 
0 a
1 b
2 c

19.any() & all()

any(iterable)

  • 对于迭代过程中的元素 i,只有所有元素 bool(i) 的结果都为 False,any 的结果才返回 False。
  • 如果迭代是空,返回 False。

all(iterable)

  • 对于迭代过程中的元素 i,如果存在一个 bool(i) 的结果为 False,则 all 结果返回 False。
  • 如果可迭代对象为空,则返回 True。
>>> any('')
False
>>> any([])
False
>>> any([10''])
True
>>> any([0'', []])
False
>>> all([])
True
>>> all([10''])
False
>>> all([123])
True

20.用 ** 代替 pow

求 x 的 y 次方,使用 ** 速度更快。

%timeit -n 10000 c = pow(2,10)
# 911 ns ± 107 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
%timeit -n 10000 c = 2 ** 10
# 131 ns ± 46.8 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
对比Excel系列图书累积销量达15w册,让你轻松掌握数据分析技能,感兴趣的同学可以直接在各大电商平台搜索书名了解:

浏览 11
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报