Pandas三大利器-map、apply、applymap

共 3165字,需浏览 7分钟

 ·

2022-03-04 14:09

实际工作中,我们在利用 pandas进行数据处理的时候,经常会对数据框中的单行、多行(列也适用)甚至是整个数据进行某种相同方式的处理,比如将数据中的 sex字段将 男替换成1,女替换成0

在这个时候,很容易想到的是 for循环。用 for循环是一种很简单、直接的方式,但是运行效率很低。本文中介绍了 pandas中的三大利器: mapapplyapplymap 来解决上述同样的需求。

  • map

  • apply

  • applymap

—  01 

模拟数据

通过一个模拟的数据来说明3个函数的使用,在这个例子中学会了如何生成各种模拟数据。数据如下:

  1. import pandas as pd

  2. import numpy as np


  3. boolean = [True, False]

  4. gender = ["男","女"]

  5. color = ["white","black","red"]


  6. # 好好学习如何生成模拟数据:非常棒的例子

  7. # 学会使用random模块中的randint方法


  8. df = pd.DataFrame({"height":np.random.randint(160,190,100),

  9. "weight":np.random.randint(60,90,100),

  10. "smoker":[boolean[x] for x in np.random.randint(0,2,100)],

  11. "gender":[gender[x] for x in np.random.randint(0,2,100)],

  12. "age":np.random.randint(20,60,100),

  13. "color":[color[x] for x in np.random.randint(0,len(color),100)]

  14. })

  15. df.head()

—  02 

map

demo

map() 会根据提供的函数对指定序列做映射。

第一个参数 function 以参数序列中的每一个元素调用 function 函数,返回包含每次 function 函数返回值的新列表

  1. map(function, iterable)

实际数据

将gender中男变成1,女变成0

  1. # 方式1:通过字典映射实现

  2. dic = {"男":1, "女":0} # 通过字典映射

  3. df1 = df.copy() # 副本,不破坏原来的数据df

  4. df1["gender"] = df1["gender"].map(dic)

  5. df1


  6. # 方式2:通过函数实现

  7. def map_gender(x):

  8. gender = 1 if x == "男" else 0

  9. return gender


  10. df2 = df.copy()

  11. # 将df["gender"]这个S型数据中的每个数值传进去

  12. df2["gender"] = df2["gender"].map(map_gender)

  13. df2

—  03 

apply

apply方法的作用原理和 map方法类似,区别在于 apply能够传入功能更为复杂的函数,可以说 apply是 map的高级版

pandas 的 apply() 函数可以作用于 Series 或者整个 DataFrame,功能也是自动遍历整个 Series 或者 DataFrame, 对每一个元素运行指定的函数。

在 DataFrame对象的大多数方法中,都会有 axis这个参数,它控制了你指定的操作是沿着0轴还是1轴进行。 axis=0代表操作对 columns进行, axis=1代表操作对 row进行

demo

  1. 上面的数据中将age字段的值都减去3,即加上-3

  1. def apply_age(x,bias):

  2. return x + bias


  3. df4 = df.copy()

  4. # df4["age"]当做第一个值传给apply_age函数,args是第二个参数

  5. df4["age"] = df4["age"].apply(apply_age,args=(-3,))

  1. 计算BMI指数

  1. # 实现计算BMI指数:体重/身高的平方(kg/m^2)

  2. def BMI(x):

  3. weight = x["weight"]

  4. height = x["height"] / 100

  5. BMI = weight / (height **2)


  6. return BMI


  7. df5 = df.copy()

  8. df5["BMI"] = df5.apply(BMI,axis=1) # df5现在就相当于BMI函数中的参数x;axis=1表示在列上操作

  9. df5

DataFrame型数据的 apply操作总结:

  1. 当 axis=0时,对 每列columns执行指定函数;当 axis=1时,对 每行row执行指定函数。

  2. 无论 axis=0还是 axis=1,其传入指定函数的默认形式均为 Series,可以通过设置 raw=True传入 numpy数组

  3. 对每个Series执行结果后,会将结果整合在一起返回(若想有返回值,定义函数时需要 return相应的值)

apply实现需求

通过apply方法实现上面的性别转换需求。apply方法中传进来的第一个参数一定是函数

—  04 

applymap

DF数据加1

applymap函数用于对DF型数据中的每个元素执行相同的函数操作,比如下面的加1:

保留2位有效数字





推荐阅读:

入门: 最全的零基础学Python的问题  | 零基础学了8个月的Python  | 实战项目 |学Python就是这条捷径


干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 |   从万众期待到口碑扑街!唐探3令人失望  | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |碟中谍这么火,我用机器学习做个迷你推荐系统电影


趣味:弹球游戏  | 九宫格  | 漂亮的花 | 两百行Python《天天酷跑》游戏!


AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影


小工具: Pdf转Word,轻松搞定表格和水印! | 一键把html网页保存为pdf!|  再见PDF提取收费! | 用90行代码打造最强PDF转换器,word、PPT、excel、markdown、html一键转换 | 制作一款钉钉低价机票提示器! |60行代码做了一个语音壁纸切换器天天看小姐姐!


年度爆款文案

点阅读原文,看200个Python案例!

浏览 31
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报