Python数据分析之聚合与透视表

统计与数据分析实战

共 1163字,需浏览 3分钟

 ·

2020-08-21 04:25


◆ ◆ ◆  ◆ 


严小样儿原创第N篇~

读取数据


Python用于数据分析好不好,因人而异。
但是,excel能做的Python也能做。比如聚合,透视表。我认为更简单一下。
如果大家在工作中用得到数据库,用得到Python,可以学习一下数据透视表。

第一步:读取数据
import pymysqlimport pandas as pdimport matplotlib.pyplot as plt
# 建立连接conn = pymysql.connect('localhost','username','password','database')
# 读取SQL为dfsql = 'select * from table'df = pd.read_sql(sql,con=conn)

数据聚合


第二步:数据聚合

# 查看基本属性print(df.index)print(df.columns)print(df.info())
# 修改时间格式df['stat_month'] = pd.to_datetime(df['stat_month'],format='%Y%m')
# 设置索引df.set_index('stat_month',inplace = True)print(df.head())
# 只看一个月份的df_grp1601= df['20160101'].groupby(['brand','areaname'],as_index = False)['profit'].sum()print(df_grp1601)
df_grpbrand = df_grp1601.groupby('brand').sum()print(df_grpbrand[df_grpbrand>200000].plot(kind = 'bar'))



数据透视表


第三步:数据透视表
pd.pivot_table(df['20160101':'20161201'],values = 'profit',\               index = ['stat_month','brand'],\               columns ='areaname',aggfunc='sum' )



祝大家早日富可敌国!


记得

在看


—— END ——

Python数据分析神器Pandas与数据库查询语言SQL的对比


excel VS python 谁更适合数据分析?


一文解决伪分布式hadoop集群搭建


在看”的永远18岁~


浏览 48
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报