普通高中选课数据分析和可视化
Python算法之旅
共 2389字,需浏览 5分钟
·
2021-05-22 21:50
前段时间一直没有更新公众号,不是因为懒,而是一直在憋一个大招。
加入“边楚女特级教师工作站”以后,边老师给我们小组分配的任务是为必修一《数据与计算》第四章准备教学资料,我负责“编程处理数据”这一块。Python语言我接触挺长一段时间了,之前主要研究海龟绘图,使用Python编程进行数据分析和可视化对我来说也是一个新的挑战,numpy、pandas和matplotlib模块都要一点一点学起来。
项目式学习不是空喊口号,做项目确实是学习编程的最佳途径,我自己就是这样一步步成长起来的。为了更好地掌握使用Python编程进行数据分析和可视化的方法,我精心挑选了3个难度适中的项目(主要是已有大量数据,不需要花大力气在采集数据上),从零开始,实践了数据分析和可视化的过程,在踩坑填坑的过程中,一点点提高技术水平,对pandas和matplotlib模块有了较为深刻的理解。
现在我以项目分析报告的形式,把自己做的一些东西拿出来与大家分享,希望各位老师多多批评指正。
“普通高中选课数据分析和可视化”项目分析报告
#读数据到 Pandas的DataFrame 结构中
df = pd.read_csv("xk73.csv",sep=',',header='infer',encoding='utf-8')
#按学校分组计数
sc = df.groupby('学校代码',as_index=False).count()
# 对分组计数结果进行合计,合计结果转换为DataFrame结构并转置为行
df_sum = pd.DataFrame(data=sc.sum()).T
df_sum['学校代码'] = '合计'
result = sc.append(df_sum)
说明:因为本项目内容较多,故写成系列文章分成多次分享,请大家稍安勿躁哦。
需要本文word版或者相关源代码的,可以加入“Python算法之旅”知识星球参与讨论和下载文件,“Python算法之旅”知识星球汇集了数量众多的同好,更多有趣的话题在这里讨论,更多有用的资料在这里分享。
我们专注Python算法,感兴趣就一起来!
相关优秀文章:
斌哥教你自制多功能单词本
斌哥教你自制象棋打谱软件
斌哥教你自制围棋打谱软件
斌哥教你自制思维导图生成器改进版
斌哥教你绘制文件夹目录树(一)
斌哥教你绘制文件夹目录树(二)
斌哥教你绘制文件夹目录树(三)
评论