数据分析应该用什么?6款常用工具对比
Crossin的编程教室
共 2960字,需浏览 6分钟
· 2024-04-10
大家好,欢迎来到 Crossin的编程教室~ “数据分析” 可谓是当今社会一个超级火爆的岗位,不论是科班的,还是非科班的,都想从事这个行业,毕竟都觉得这个行业赚钱多嘛。 “数据分析” 大致可以分为业务和技术两个方向,不管你是从事哪个方向,都对技能有一定的要求。业务方向,像数据运营、商业分析、产品经理等,对技术的要求相对来说低一点,编程工具你只要会用即可(肯定是越精通越好)。技术方向,像数据算法工程师、数据挖掘工程师等,对技术的要求就很高了,必须要有很好的编程能力。 工欲善其事必先利其器 ,说起数据分析工具,大家都会感觉很迷茫,有这么多数据分析工具,我应该学习哪个工具,它们之间的区别到底是什么?今天我们从 “工具” 层面带大家盘点一下,作为一名数据分析师,应该学习哪些工具呢?
② python的工程化应用强于R,可移植性更强。
③ python的应用场景大于R,仿佛R可以做的,Python基本可以,它不擅长的,Python也可以。
④ 如果是统计理论研究、前沿科学研究,R比python更胜一筹。R的使用人群主要是一些高校、医药的统计学家,这就是为什么大学老师都用R的原因。
Crossin的新书《码上行动:用ChatGPT学会Python编程》已经上市了。 本书以ChatGPT为辅助,系统全面地讲解了如何掌握Python编程,适合Python零基础入门的读者学习。 【点此查看详细介绍】 购买后可加入读者交流群,Crossin为你开启陪读模式,解答你在阅读本书时的一切疑问。 Crossin的其他书籍:
添加微信 crossin123 ,加入编程教室共同学习 ~
1. Excel工具
说起用什么做数据分析,很多人的脑海中都会不约而同地想到Python、R、SQL、Hive等看似很难掌握的数据分析工具,它们就像数据分析路上的拦路虎一样,让人踟蹰不前。 其实,在众多的数据分析工具中,Excel属于最常用、最基础、最易上手的一款数据分析工具。Excel的功能十分强大,它不仅提供了众多的数据处理功能,像Excel函数能够帮助我们做数据整理,数据透视表帮助我们快速、高效的做各种维度分析,形形色色的图表能帮我们形象地展示出数据背后隐藏的规律,同时Excel还有很专业的数据分析工具库,包括描述性统计分析、相关系数分析等。 Excel对于转行数据分析的小白来说,应该是最友好的。大家都知道“转行”其实是一件很困难的事儿,但是你学会了Excel,是完全可以找到一份“数据”相关的工作的,只有踏进数据领域,你才有可能从事其它更多的数据岗位。2. BI工具
BI工具是专门按照数据分析的流程进行设计的,也是专门用于数据分析的工具。仔细观察这些工具后,它们的基本流程是:【数据处理】-【数据清洗】-【数据建模】-【数据可视化】。 关于BI工具,其实有很多你估计已经用到过,比如说Tableau、Power BI,还有帆软等。今天我们就分别带着大家来盘点一下,这三款工具。2.1Tableau
Tableau是三位斯坦福人 Dr. Pat Hanrahan, Dr. Chris Stotle, Christian Chabot 于2003年成立的,这是一款交互式数据可视化软件,它的本质其实也是Excel的数据透视表和数据透视图。 Tableau也是很好的延续了Excel,只需要简单地拖拽,就能很快地实现数据的分类汇总,然后拖拽实现各种图形的绘制,并且可以实现不同图表之间的联合。 Tableau同时支持数百种数据连接器,包括在线分析处理(OLAP)和大数据(例如NoSQL,Hadoop)以及云数据,至少现在你能学到的数据库软件,Tableau基本都能够实现与其数据之间的互动。2.2 Power BI
Power-BI是一款(BI)商业智能软件,于2014年发布,旨在为用户提供交互式的可视化和商业智能,简单的数据共享,数据评估和可扩展的仪表板等功能。。 大家可能都知道,Power BI以前是一款Excel插件,依附于Excel,比如Power Query,PowerPrivot, Power View和Power Map等,这些插件让Excel如同装上了翅膀,瞬间高大上,慢慢地就发展成为现在的Power BI数据可视化工具。 Power BI 简单且快速,能够从 Excel电子表格或本地数据库创建图表。同时Power BI也是可靠的、企业级的,可进行丰富的建模和实时分析,及自定义开发。因此它既是你的个人报表和可视化工具,还可用项目、部门或整个企业背后的分析和决策引擎。Power BI的分析功能很强大,它的PowerPivot 和DAX语言,让我们能够编写类似Excel中的公式,来进行复杂的高级分析。 同时,无论你的数据是简单的 Excel电子表格,还是基于云和本地混合数据仓库的集合, Power BI都可以让你轻松地连接到数据源,直观看到或发现数据的价值,与任何所希望的人进行共享。 最后我们简单说说Power BI的组成部分,大家可以自行下去查看学习。 Power BI 包含 Windows 桌面应用程序(称为 Power BI Desktop )、联机 SaaS (软件即服务)服务(称为 Power BI 服 务),及移动 Power BI 应 用(可在 Windows 手机和平板电脑及 iOS 和 Android 设备上使用)。 PowerBI 有三个用于不同场景的组件: PowerQuery (数据处理组件), PowerPivot (轻量级建模组件), PowerBI Desktop (独立数据可视化程序)。2.3 finereport
帆软是业内做报表比较久的一家公司,使用类excel风格的界面,可添加图表和数据源,也可实现大屏效果。 其实它的类Excel风格界面,应该是它区别于Tableau工具的一个很重要的点。FineReport 通过直接连接到各种数据库,就能方便快捷地自定义各种样式,从而制作周报、月报和季报、年报。 用过FineReport 的朋友,还会有另外一种体会,它的图形效果比Tableau要酷炫的多,操作起来同样也是那样的方便。 另外,FineReport 的个人版本是完全免费的,并且所有功能都是开放的,大家赶紧下去试试吧。3. Python & R
其实不管是Excel,还是介绍的三款BI工具,它们都是为了执行特定功能,而设计出来的。如果说某一天,既定功能不能很好,或者说不能满足你的需求,那么应该怎么办呢? 这就需要我们了解,并学习一点编程语言了,最大的优势就在于:它非常强大和灵活。不管是R或者 Python,都有很多包供我们调用,同时也可以自定义函数,实现我们的某些需求。3.1 简介
3.2 其他对比
① python与R相比速度要快。② python的工程化应用强于R,可移植性更强。
③ python的应用场景大于R,仿佛R可以做的,Python基本可以,它不擅长的,Python也可以。
④ 如果是统计理论研究、前沿科学研究,R比python更胜一筹。R的使用人群主要是一些高校、医药的统计学家,这就是为什么大学老师都用R的原因。
作者:黄伟呢
来源:数据分析与统计学之美Crossin的新书《码上行动:用ChatGPT学会Python编程》已经上市了。 本书以ChatGPT为辅助,系统全面地讲解了如何掌握Python编程,适合Python零基础入门的读者学习。 【点此查看详细介绍】 购买后可加入读者交流群,Crossin为你开启陪读模式,解答你在阅读本书时的一切疑问。 Crossin的其他书籍:
添加微信 crossin123 ,加入编程教室共同学习 ~
感谢 转发 和 点赞 的各位~
评论
“海优最初弄出来可并不是为了给大佬弟子开后门的, 学术界现在几乎不存在任何套利空间,不要相信有什么办法可以投机取巧”
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达知乎问题:为什么部分同学倾向土博+国外博后而不是直接国外读博?感觉身边土博越来越多,基本都是土博➕海博后,申国外phd的明显减少(相比较疫情之前几年)知乎Tianteman: 这个问题下,可以看得出一部分国内硕博信息检索能力差的离
小白学视觉
0
CVPR 2024|大视觉模型的开山之作!无需任何语言数据即可打造大视觉模型
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达作者丨科技猛兽编辑丨极市平台极市导读 本文提出一种序列建模 (sequential modeling) 的方法,不使用任何语言数据,训练大视觉模型。本文目录1 序列建模打造大视觉模型(来自 UCB,Johns Hopki
小白学视觉
0
英伟达Blackwell平台网络配置分析
本文来自“英伟达Blachwell平台网络配置详解”。GTC大会英伟达展示了全新的 Blackwell 平台系列产品,包括 HGX B100 服务器、NVLINK Switch、GB200Superchip Computer Node、Quantum X800 交换机和 CX8 网卡(InfiniB
架构师技术联盟
0
CVPR 2024|大视觉模型的开山之作!无需任何语言数据即可打造大视觉模型
↑ 点击蓝字 关注极市平台作者丨科技猛兽编辑丨极市平台极市导读 本文提出一种序列建模 (sequential modeling) 的方法,不使用任何语言数据,训练大视觉模型。>>加入极市CV技术交流群,走在计算机视觉的最前沿本文目录1 序列建模打造大视觉模型(来自 U
极市平台
1
管理世界2024 | 使用管理层讨论与分析测量「企业人工智能指标」
Tips: 公众号推送后内容只能更改一次,且只能改20字符。如果内容出问题,或者想更新内容, 只能重复推送。为了更好的阅读体验,建议阅读本文博客版, 链接地址 https://textdata.cn/blog/2024-04-19-ai-improve-firm-productivity/
大邓和他的Python
0
推荐 | 文本分析库cntext2.x使用手册
Tips: 公众号推送后内容只能更改一次,且只能改20字符。 如果内容出问题,或者想更新内容, 只能重复推送。 为了更好的阅读体验,建议阅读本文博客版, 链接地址https://textdata.cn/blog/2024-04-27-cntext2x-usage-tutorial/cntext是大邓
大邓和他的Python
1
展讯平台手机重启问题分析指南
和你一起终身学习,这里是程序员Android经典好文推荐,通过阅读本文,您将收获以下知识点:一、 User 版本 默认开启 sysdump 方法二、插入SD卡 抓取Sysdump log三、 sysdump log 分析四、展讯平台抓取重启 串口log的方案五、展讯平台判断重启类型六、展讯平台关闭
程序员Android
0
美国司法部重判币安创始人CZ,他到底做错了什么?
注:4月24日,美国司法部表示币安创始人兼前首席执行官赵长鹏应在监狱服刑三年(36个月),根据给出的理由显示,美国司法部律师认为赵长鹏帮助币安违反联邦制裁和洗钱法,并称其必须付出更大的代价,所以应该提高刑期。就在审判前,CZ在写给负责此案件的法官理查德· A · 琼斯的一封信中,为自己的「错误决定」
区块链头条
3