【Python】Autoviz: 一行代码搞定数据集探索并可视化
机器学习初学者
共 1362字,需浏览 3分钟
· 2021-10-09
数据集各个特征有什么变化趋势、各个特征之间有何关系,我们可以借助Matplotlib、Seaborn等诸多工具来可视化展示,那么有没有一种工具能一次展示所有的关系了?
本文要介绍的Python工具Autoviz,一行代码即可完成对数据集所有关系的探索 (Exploratory Data Analysis,EDA)。
安装
pip install autoviz
一行代码搞定数据探索
本次以探索鸢尾花 (iris)数据集为例子,数据集详细介绍👉👉鸢尾花数据集详细介绍,大概是这样autoviz使用,
from autoviz.AutoViz_Class import AutoViz_Class
#AutoViz实例化
AV = AutoViz_Class()
#一行代码实现数据探索
dft = AV.AutoViz(
filename='/Users/xmy/Desktop/jobs/py/iris.csv', #读入数据集,注意和dfte的区别
sep=",", #设置数据集分隔符,默认为逗号
depVar="species", #设置因变量
dfte=None, #传入一个pandas.DataFrame,如果filename已设置,此处为None,反之亦然
header=0,
verbose=0, #可选0, 1或者2,设置图形的保存形式
lowess=False, #是否启用lowess回归,适合小数据量数据集,100,000行以上数据不建议用
chart_format="svg", #设置图形保存格式
max_rows_analyzed=150000, #设置数据集待分析的行数
max_cols_analyzed=30, #设置数据集待分析的列数
)
结果输出一部分为Dataset的简单介绍
,结果输出另一部分为大量可视化图表
, 以上整个过程仅仅需要4.226秒
No categorical or boolean vars in data set. Hence no pivot plots...
No categorical or numeric vars in data set. Hence no bar charts.Time to run AutoViz \(in seconds\) = 4.226
###################### VISUALIZATION Completed ########################
参考:https://github.com/AutoViML/AutoViz
-END-
往期精彩回顾 本站qq群851320808,加入微信群请扫码:
评论
堪称最优秀的Docker可视化管理工具——Portainer你真的会用吗?
来源:blog.csdn.net/shark_chili3007/article/details/123366179👉 欢迎加入小哈的星球 ,你将获得: 专属的项目实战 / Java 学习路线 / 一对一提问 / 学习打卡 / 赠书福利全栈前后端分离博客项目
小哈学Java
0
老爸嘲讽我了,写破代码一年就挣十几万,他在工地带50个工人,一个月光人头费就3万,让我滚回去跟他干!
点击上方 "大数据肌肉猿"关注, 星标一起成长点击下方链接,进入高质量学习交流群今日更新| 1052个转型案例分享-大数据交流群来自:网络,侵删有个网友的父亲是做工程的,天天就嘲笑他,说他天天写着破代码有啥用,一年就拿个十多万的死工资,然后告诉他自己在工地里面带了50个工人,一个月能抽三万
程序源代码
0
JavaScript 可视化:Promise执行彻底搞懂
深入探讨了 JavaScript 中 Promise 的内部机制,解释了它们如何使异步任务以非阻塞方式执行,并展示了 Promise 的创建、状态变化以及与事件循环的关系。正文从这开始~~JavaScript 中的 Promise 一开始可能会让人感到有些难以理解,但是如果我们能够理解其内部的工作原
高级前端进阶
0
大厂都在用的 Git 代码管理规范 !
👉 欢迎加入小哈的星球 ,你将获得: 专属的项目实战 / Java 学习路线 / 一对一提问 / 学习打卡 / 赠书福利全栈前后端分离博客项目 2.0 版本完结啦, 演示链接:http://116.62.199.48/ ,新项目正在酝酿中
小哈学Java
2
这五款牛逼的 IDEA 插件,堪称代码质量检查利器!
来源:blog.csdn.net/a745233700?type=blog一、Alibaba Java Coding Guidelines二、CheckStyle:三、PMD四、FindBugs:五、SonarLint:总结随着业务的发展,系统会越来越庞大,原本简单稳定的功能,可能在不断迭代后复杂度
码农突围
0
强烈推荐一款好用到爆的可视化拖拽库
大厂技术 高级前端 Node进阶点击上方 程序员成长指北,关注公众号回复1,加入高级Node交流群今天给大家推荐这款拖拽组件VueDraggablePlus,试了一下非常不错,据说还被尤雨溪推荐过,咱们国人自己开发的,中国人不骗🇨🇳人,我就再来推
程序员成长指北
2
JavaScript 可视化:Promise执行彻底搞懂
大厂技术 高级前端 Node进阶点击上方 程序员成长指北,关注公众号回复1,加入高级Node交流群深入探讨了 JavaScript 中 Promise 的内部机制,解释了它们如何使异步任务以非阻塞方式执行,并展示了 Promise 的创建、状态变
程序员成长指北
2
21.3K star!推荐一款可视化自动化测试/爬虫/数据采集神器!功能免费且强大!
【温馨提示】由于公众号更改了推送规则,不再按照时间顺序排列,如果不想错过测试开发技术精心准备的的干货文章,请将测试开发技术设为“星标☆”,看完文章在文尾处点亮“在看”!大家好,我是狂师!在大数据时代,信息的获取与分析变得尤为重要。对于开发者、数据分析师乃至非技术人员来说,能够高效地采集网络数据并进行
测试开发技术
4