太香!一行代码搞定端到端数据分析报告!
Python学习与数据挖掘
共 1000字,需浏览 2分钟
·
2021-03-29 01:54
Python 是程序员和数据科学家最常用的编程语言之一。在现实世界中,数据在每个行业中都起到了非常重要的因素,当我们做任何项目时,我们都需要先了解数据。
我们需要编写不同的编程逻辑、分析、进一步的建模来了解数据,这样往往需要花费大量时间。在python中有一个名称为 pandas_profiling,它可以用一行来创建端到端数据分析报告。
pandas_profiling
pandas_profiling 是python中最著名的库之一,使用它只需一行代码就可以立刻获取数据分析报告。
安装
要安装此库,可以使用pip命令,如下所示:
pip install pandas_profiling
导入库
import pandas_profiling
import pandas as pd
数据
本文中实用的数据为开源房屋价格数据,如果你需要练习,可以文末下载。
df= pd.read_csv('train.csv')
获取数据分析报告
我们准备好数据,就可以使用 python 代码的一行来生成数据剖析报告,如下所示:
hourse_price_report=pandas_profiling.ProfileReport(df)
运行如下命令后,我们将看到进度条,该进度条根据特定参数生成数据概要分析报告。
将报告另存为HTML格式
成功生成报告后,我们可以将报告另存为HTML文件并与他人共享。可以使用下面的代码行将报告保存为HTML格式。
hourse_price_report.to_file('house_report.html')
从数据分析报告中获得什么
总体数据汇总
有关每个变量的详细信息
变量之间每个相关性的详细可视化
缺失值统计
不同类别的相互联系
结论
上面已经详细介绍了数据分析报告。分析报告可以为我们提供数据的总体摘要、有关每个功能的详细信息、组件之间关系的直观表示、有关缺失数据的细节以及可以帮助理解数据的更多有趣的见解。关注我,了解更多技术干货。
文中数据获取
领取方式:
长按下方二维码,后台发消息:房屋
评论