数据分析'四件套'你备好了嘛
数据森麟
共 1584字,需浏览 4分钟
·
2020-04-07 23:26
作者:拿破仑的DO君
来源:数据氧气
随着数据量越来越大,依赖于数据决策的场景越来越多,使用工具对于数据进行分析,越来越成为一个职场人必备的一项技能。那么如果要更自如的进行数据分析,就必须掌握几个数据分析常用的工具。俗话说的好:工欲善其事必先利其器。那么数据分析常备的工具是啥呢?神器组合:xmind + sql+power bi +excel。我自己在实际工作中也是屡试不爽的。01工具包
工具都是有自己的适用场景的,知道什么场景下用什么样的工具,可以最大程度的提高自己的效率。各个工具的使用场景和顺序:
02微软的商业智能'利器'
有些人可能对于POWER BI比较陌生,参考我之前的一篇文章来个科普贴。我自己是从2018年工作中接触到POWER BI,自那以后也是比较痴迷于它。-POWER BI与excel处理逻辑相似,由于它是微软公司做的商业智能软件。-从excel演变而来,计算表达式与excel的函数表达式很像,区别是POWER BI的函数直接作用于一列或者一张表。-学习成本比SQL和Python都要简单,基本上能应付绝大部分数据分析场景。-本身使用是免费的。
下面以一个案例来讲下POWER BI使用及优势。Kaggle上的一个零售数据集:某英国在线零售商8个月订单数据,订单表,产品维度表(是我随意打标签的创造的一个):stockcode: 产品code,invoiceNo:订单号,invoicedate:下单日期,unitprice:单价,quantity:数量,customerid:顾客id;我们从数据分析项目的流程来简单讲下优势(操作步骤见下图演示):- 数据清洗整理(多数据源导入,清理模板,数据量大时候,速度快,数据基本空值情况)可以从多数据源导入数据,本案例导入了csv和excel文件两种(1&2);然后在power query进可以看到列中的空值与错误值情况(3),用行了清洗,去除空值和负值,这些清理操作会被保留下来(4),下次更新数据源,不用再操作一遍。
◆ ◆ ◆ ◆ ◆
长按二维码关注我们
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码:
评论