Python数据分析之聚合与透视表
统计与数据分析实战
共 1163字,需浏览 3分钟
·
2020-08-21 04:25
◆ ◆ ◆ ◆ ◆
import pymysql
import pandas as pd
import matplotlib.pyplot as plt
# 建立连接
conn = pymysql.connect('localhost','username','password','database')
# 读取SQL为df
sql = 'select * from table'
df = pd.read_sql(sql,con=conn)
第二步:数据聚合
# 查看基本属性
print(df.index)
print(df.columns)
print(df.info())
# 修改时间格式
df['stat_month'] = pd.to_datetime(df['stat_month'],format='%Y%m')
# 设置索引
df.set_index('stat_month',inplace = True)
print(df.head())
# 只看一个月份的
df_grp1601= df['20160101'].groupby(['brand','areaname'],as_index = False)['profit'].sum()
print(df_grp1601)
df_grpbrand = df_grp1601.groupby('brand').sum()
print(df_grpbrand[df_grpbrand>200000].plot(kind = 'bar'))
pd.pivot_table(df['20160101':'20161201'],values = 'profit',\
index = ['stat_month','brand'],\
columns ='areaname',aggfunc='sum' )
祝大家早日富可敌国!
记得
点
在看
哦
Python数据分析神器Pandas与数据库查询语言SQL的对比
评论