教你Python字典的妙用,消除繁琐的if判断

共 1678字,需浏览 4分钟

 ·

2021-06-27 03:09

↑↑↑关注后"星标"简说Python

人人都可以简单入门Python、爬虫、数据分析
 简说Python推荐 
来源:数据大宇宙
作者:卡门的儿子

前言

大家好,我是老表

根据不同的条件进行不同的计算或操作,是很常见的需求。Python 有 if 语句可以实现。但是一旦分支很多,多个 if 就是使你眼花缭乱。

我们有许多技巧(套路)来简化这一过程。我会一连几篇文章,从简单到复杂,教你如何理解和应用这些技巧。

这里,你可以学到很多 Python 知识点的应用:

  1. 字典

  2. 枚举

  3. 装饰器


动态调用不同的函数

先看数据:

  • 列[计算方式],决定了列[调整]的计算结果

每一种计算方式如下:

聪明的方法,为每一种计算单独定义了函数:

但是,该怎么调用这些函数呢?

"很简单呀,判断,然后调用":

  • 行9:为了防止出现遗漏的计算方式

这看起来不错,但是,每新增一种方式,就要在这里追加一个判断,一旦分支很多,这里的代码就会非常冗长:

为什么我一直让每一块代码尽可能简短?

因为我们每次处理一个独立小问题会比处理大问题要高效得多,大问题意味着涉及很多小问题。同时解决多个小问题,会让我们的大脑短路。


单独声明映射关系

如果我们可以这样子定义计算方式与函数的关系,那就很舒服了:

"这看着有点眼熟,不就是字典吗?"

对,字典就是用来表达这种一对一关系的最佳结构。

你可以把字典当作是一个过目不忘(死记硬背)的记忆高手,只要他过一遍数据之后,你给他一个 key 值,他能马上找出对应的 value 值给你。

于是,我们可以把计算方式与定义的每个函数给他记忆:

接下来,真正处理每一行数据的时候,只需要让他(字典)取出函数,然后调用即可:

  • 行2-4:特别要注意,字典的 value 我们只是给了函数名字,千万别在后面加括号,括号是表示执行函数。现在我们不需要执行函数呢

  • 调用的时候,别忘记给函数传入需要计算的指标

  • 不仅代码简单了,如果你有留意左下角的运行时间,你会发现这种方式比之前的方式提速了

现在我们的代码挺不错,如果数据中出现了新的计算方式,但我们忘记加入字典,那么代码运行就会报错:

  • 行4:注释掉,相当于我们忘记定义计算方式C

  • 可以看到错误信息,能让我们马上联想到原因

"一举两得,太完美了!"

但是,如果你跟我学习 pandas ,就会知道,pandas 中尽可能避免自己遍历处理数据。

pandas 的简洁程度与计算效率不是我们自己遍历处理可以比得过。


pandas 处理方式真的就完美?

这个例子中,每一种的计算方式的区别仅仅在于后面的系数:

这种情况下,其实我们可以先批量把每一行对应的系数取出来,然后直接计算:

  • 注意执行时间,又提速了

别以为这只是 pandas 把 for 遍历给你写了而已,他是基于 numpy 的,而numpy处理时都是基于 c++ 的调用,性能非常快速

这种方式其实也有他的缺点:

  1. Series.map 方法的确做了字典取值做的事情,但是在他找不到key时,是不会报错的。我们需要后续通过判断 nan 来检查

  2. 有时候计算逻辑没有这么简单,比如需要看销量是否超过同地区的平均值做出不同的计算分支。这时候使用 pandas 的方式就会感觉逻辑被分散(下一节我们来看看这种情况下的处理)

"那么,之前的字典声明方式,是不是就是这种场景下最通用的方式?"


思考题

用字典声明对应关系其实已经非常好了,但是如果能在定义函数的地方上直接标记对应关系,那么也挺好:

  • 不再需要定义字典关系了

怎么可以做到这种效果呢?有兴趣的小伙伴不妨试试。

--END--



扫码即可加我微信

老表朋友圈经常有赠书/红包福利活动


学习更多:
整理了我开始分享学习笔记到现在超过250篇优质文章,涵盖数据分析、爬虫、机器学习等方面,别再说不知道该从哪开始,实战哪里找了

优秀的读者都知道,“点赞”传统美德不能丢 

浏览 36
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报