对比Excel,学习pandas数据透视表
大数据DT
共 3610字,需浏览 8分钟
·
2021-06-08 04:21
导读:更简单了呢~
01 Excel中做数据透视表
02 pandas用pivot_table()做数据透视表
pd.pivot_table(data,index=None,columns=None,
values=None,aggfunc='mean',
margins=False,margins_name='All',
dropna=True,fill_value=None)
data 相当于Excel中的"选中数据源"; index 相当于上述"数据透视表字段"中的行; columns 相当于上述"数据透视表字段"中的列; values 相当于上述"数据透视表字段"中的值; aggfunc 相当于上述"结果"中的计算类型; margins 相当于上述"结果"中的总计; margins_name 相当于修改"总计"名,为其它名称。
dropna 表示是否删除缺失值,如果为True时,则把一整行全作为缺失值删除; fill_value 表示将缺失值,用某个指定值填充。
03 案例说明
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))
df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))
df1 = pd.pivot_table(df,index="品牌",columns="月份",
values="销售数量",aggfunc=np.sum)
display(df1)
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))
df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))
df1 = pd.pivot_table(df,index="品牌",columns=["销售区域","月份"],
values="销售数量",aggfunc=np.sum)
display(df1)
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))
df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))
df1 = pd.pivot_table(df,index=["品牌","销售区域"],columns="月份",
values="销售数量",aggfunc=np.sum)
display(df1)
df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))
df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))
df1 = pd.pivot_table(df,index="品牌",columns="月份",
values=["销售数量","货号"],
aggfunc={"销售数量":"sum","货号":"count"},
margins=True,margins_name="总计")
display(df1)
评论