中国高校数据分析项目
一、数据源
本项目使用了两个csv的数据文件,一个是中国高校(大学)的数据,一个是中国高校专业设置的数据
数据基本栏位:
高校(大学)的数据 | 高校专业设置的数据 |
---|---|
学校 | 学校 |
省份 | 专业类别 |
城市 | 专业名称 |
地址 | 国家特色专业 |
水平层次 | |
办学类别 | |
办学类型 | |
985 | |
211 | |
双一流 |
二、数据分析目标
本项目主要使用了学校、省份、水平层次、办学类别、985、211、双一流、专业名称、国家特色专业等数据,通过pandas相关模块对数据进行抽取、清洗和分组统计计算,再而用pyecharts数据可视化模块绘制交互式可视化图表,分析得出各省大学数量分布、本科,专科占比、各办学类别占比、985,211,双一流学校分布、开设数量前二十的专业以及国家特色专业分布等数据结果,旨在结合这些数据分析中国目前高校(大学)办学状况、中国开设数量排名前20的热门专业和国家特色专业主要分布在哪些学校等关于高校办学的信息,为报志愿的高考生和想了解这方面信息的人提供参考。
三、数据分析结果价值宣言
本项目分析了中国高校和专业的相关数据,旨在结合这些数据分析中国目前高校(大学)办学状况、中国开设数量排名前20的热门专业和国家特色专业主要分布在哪些学校等关于高校办学的信息,为报志愿的高考生和想了解这方面信息的人提供信息和参考。
四、数据分析结果可视化
4.1 可视化模块介绍
本项目使用的是pyecharts可视化模块绘制交互式可视化图表 (使用时需要在电脑安装pyecharts模块才可成功运行哦) pyecharts简介:pyecharts 是一个用于生成 Echarts 图表的类库。Echarts 是百度开源的一个数据可视化 JS 库,可以生成一些非常酷炫的图表,pyecharts是国人开发的一个Echarts与Python结合的模块,为了与 Python 进行对接,方便在 Python 中直接使用数据生成图
4.2 可视化结果展示以及数据故事的阐述
图表交互式可视化和更多的表格数据请查看flask网站
1.分析各省大学数量分布情况
从上图可以看出中国的高校主要分布分布在华南和华中地区,西部和西北部高校数量较少,广东、上海和江浙地区高校数量较多
2.分析本科、专科占比情况
从上图可以看出中国高校本科和专科的占比情况,两者数量相差不是很大,但专科比本科的数量要多
3.分析各办学类别占比情况
从上图可以看出中国的高校办学主要以综合类和理工类为主,民族类、体育类学校较少,各个办学类别差距较大
4.985,211,双一流院校数量对比
从上图可以看出中国985,211,双一流等重点高校的数量对比情况
5.分析985,211,双一流分布情况
从上图可以看出985学校主要分布在北京和上海等地
从上图可以看出211学校主要分布在北京、上海和江苏等地
从上图可以看出双一流学校主要分布在北京、江苏和上海等地
6.分析开设数量前二十的专业
从上图可以看出中国高校开设数量前20的热门专业
7.分析国家特色专业学校分布情况
从上图可以看出国家特色专业数量排名前20的学校
总结
从上面的可视化结果可以看出中国目前高校(大学)的办学状况,包括高校在各个省份的分布、本科和专科占比情况、各个办学类别占比情况、985,211,双一流分布情况,中国开设数量排名前20的热门专业和国家特色专业学校分布等关于高校办学的信息,为报志愿的高考生和想了解这方面信息的人提供信息和参考。
需要数据集和代码,后台回复《高校》
既往专辑