太香!一行代码搞定端到端数据分析报告!

Python学习与数据挖掘

共 1000字,需浏览 2分钟

 ·

2021-03-29 01:54

Python 是程序员和数据科学家最常用的编程语言之一。在现实世界中,数据在每个行业中都起到了非常重要的因素,当我们做任何项目时,我们都需要先了解数据。

我们需要编写不同的编程逻辑、分析、进一步的建模来了解数据,这样往往需要花费大量时间。在python中有一个名称为 pandas_profiling,它可以用一行来创建端到端数据分析报告。

pandas_profiling

pandas_profiling 是python中最著名的库之一,使用它只需一行代码就可以立刻获取数据分析报告。

安装

要安装此库,可以使用pip命令,如下所示:

pip install pandas_profiling

导入库

import pandas_profiling
import pandas as pd

数据

本文中实用的数据为开源房屋价格数据,如果你需要练习,可以文末下载。

df= pd.read_csv('train.csv')

获取数据分析报告

我们准备好数据,就可以使用 python 代码的一行来生成数据剖析报告,如下所示:

hourse_price_report=pandas_profiling.ProfileReport(df)

运行如下命令后,我们将看到进度条,该进度条根据特定参数生成数据概要分析报告。

将报告另存为HTML格式

成功生成报告后,我们可以将报告另存为HTML文件并与他人共享。可以使用下面的代码行将报告保存为HTML格式。

hourse_price_report.to_file('house_report.html')

从数据分析报告中获得什么

总体数据汇总


有关每个变量的详细信息

变量之间每个相关性的详细可视化

缺失值统计


不同类别的相互联系

结论

上面已经详细介绍了数据分析报告。分析报告可以为我们提供数据的总体摘要、有关每个功能的详细信息、组件之间关系的直观表示、有关缺失数据的细节以及可以帮助理解数据的更多有趣的见解。关注我,了解更多技术干货。

文中数据获取

领取方式:

长按下方二维码,后台发消息:房屋

浏览 58
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报