普通高中选课数据分析和可视化(5)
共 2149字,需浏览 5分钟
·
2021-06-06 17:49
前情回顾:
4.数据分析结论
4.1 各校各科选考人数统计分析
通过对某市各校人数统计,我们发现全市选课学生总人数为10690人,其中人数最多的学校编号为201904,其总人数为1188人;人数最少的学校编号为201902,其总人数为458人。在7门选考科目中,选择人数最多的是化学,共6942人,占比65%;选择人数最少的是技术,共1527人,占比14%。
通过绘制各校各科选考人数柱状图、雷达图和饼图,我们可以直观地感受到各校各科选考人数分布情况,体现了数据可视化直观、形象的优点。
通过分析各学科关联度散点图,我们发现物化生3门学科的关联度最高,即同时选考该3门学科的学生最多,这与后面获得的选课组合统计数据是一致的。另外选考政史地的学生总数虽然不多,但这3科的关联度也很大,说明学生基本上还是按照自己的学习兴趣和思维方式(偏文或偏理)来选课的。
4.2 各校各选课组合人数统计分析
通过对各校选课组合人数统计分析,我们发现全市选考组合人数最多的前三名分别是:物化生908人、物化地562人、政史地336人;最少的三个组合分别是:化史技25人、生政技17人、生史技11人。
图17 全市各选课组合人数占比饼图
图18 全市各选课组合人数柱状图
通过绘制全市各选课组合人数柱状图和饼图,以及各校各选课组合人数柱状图和饼图,我们可以直观地感受到全市和各校各选课组合人数分布情况,体现了数据可视化直观、形象的优点。
经过这一周的项目挑战,我们对Python程序设计和数据分析及可视化的知识有了更深的理解,特别是对程序设计的基本步骤以及思想有了更具体、深刻的体会。通过一次次的解决难题,使我们不仅巩固了理论知识,还培养了我们灵活运用知识、解决实际问题的能力。其次,这个项目是我们小组团队协作完成的,在项目挑战过程中,我们团队成员相互激励,相互帮助,共同面对困难和挑战,极大地激发了我们创新意识和团队协作能力。
在这次的项目挑战中,我们也体会到了程序设计的辛苦。首先是采集数据的困难,一开始我们只收集了一个学校的数据,这样数据量太少,根本无法体现大数据的威力。后来我们了解到浙江教育出版社官方网站提供了教材配套练习的素材,就登陆网站下载了包含某市10690条选课记录的csv文件,有了大数据支撑,我们的分析结果也更科学了。其次是程序编写难度较大,虽然我们已经有了一定Python编程的基础,但都是第一次接触数据分析和可视化,对pandas和matplotlib模块不熟悉,为了快速上手,我们查阅官方文档,了解的各种基本函数的功能;在项目实践过程中,我们每遇到不懂的问题就翻书和上网搜索答案,通过一次次地摸索和试错,总算完成了项目。三是团队磨合问题多,我们的项目比较复杂,功能模块很多。为了减少同学们的工作量,我们小组分工合作,将项目分成3大功能模块,在独立完成各自的模块后,再统一核实和测试代码,使代码风格尽可能一致。在团队合作的过程中,由于同学们的技术水平高低不同,不可能做到每个人完全平分工作量,但好在大家都不计较得失,能够相互理解、团结协作,总算顺利地完成了任务。
当程序终于能正常运行,获得正确的结果时,那种成就感是无以言表的。但我们小组并没有满足于只获得正确的结果,我们精益求精,继续改善代码,优化算法,想到了很多改进的思路。特别增加了生成各校固定班名册的功能,能够帮助学校教务处分班和引导同学们科学选课时,老师和同学都对我们给予了很大的肯定,我们获得了极大的满足感,觉得之前的辛苦都是值得的,同时下定决心今后要取得更大的成就。
参考文献
[1]. 主编:闫寒冰 . 信息技术必修1数据与计算. 浙江教育出版社 . 2019-8.第一版.
[2]. 作者:董付国 . Python程序设计 . 清华大学出版社 . 2020-6.第三版.
[3]. 作者:董付国 . Python数据分析、挖掘与可视化 . 人民邮电出版社.2020-2.第一版.
需要本文word版或者相关源代码的,可以加入“Python算法之旅”知识星球参与讨论和下载文件,“Python算法之旅”知识星球汇集了数量众多的同好,更多有趣的话题在这里讨论,更多有用的资料在这里分享。
我们专注Python算法,感兴趣就一起来!
相关优秀文章: