如何入手数据分析?且看资深数据分析师如何说

易观数科

共 4729字,需浏览 10分钟

 ·

2024-03-24 00:00

↑点击关注↑开启精益成长

d9663cf433cca5444c69f24ea5991860.webp


我司数据分析经理整理了数据分析入门学习的7点建议(包含4本学习书籍)+入门必备知识(包含5种分析类型+2类分析方法),助你快速成为一名初级数据分析师!

1

First Point

数据分析入门七大建议


生活中,我们在学习一门新知识的时候,首先要搞清学习目的和目前自己所处的状态。如果你是处于数据分析师的“菜鸟”阶段,要先把理论基础打牢,然后结合实操练习,在此过程中不断发现问题进而不断改进。接下来给数据分析新手,提出以下几点建议:

明确知识体系

任何一个岗位所应该具备的能力都不是单一的,而是需要多维度的学习。数据分析师不仅要对数据敏感,还要学会从数据的角度帮助团队监控、定位、分析、解决工作中的问题。在此基础上,熟悉行业知识、搭建数据分析框架、学会运用数据分析方法、掌握数据分析相关的工具、运用图表有效表达观点也是必要的技能。你在明确了数据分析师需要学习的不同模块后,然后逐一击破,形成相应的整合能力,能够使最后的效果最大化。

明确工作内容

能够解决问题的人才是最有价值的。在工作中,数据分析师一般会解决几类问题:

1)解决临时性的数据需求

2)根据业务情况,与开发工程师讨论进行相关报表开发

3)依据业务建立各类挖掘模型,与同事一起进行数据分析与挖掘,提出有效的建议观点

4)通过数据产品化方式解决结构化业务等问题

掌握底层工具

通过以上的了解,首先我们会对岗位有一个全面的认知。接下来大家就可以从简单到复杂一步步的提升自己的能力。作为数据分析师,需要熟练的进行Excel操作,特别是Excel中的一些常用的重要函数:sum,count,sumif,countif,find,if,left/right。还需要熟悉SQL数据库的基本操作。推荐学习《SQL必知必会》

0b945f8f0dc3816cc23748959f47d84c.webp


大多数互联网公司都是MySQL,你需要了解where,group by,order by,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。学会了这些底层工具的运用,会做基本的数据提取、分析和展示,就完成了基本的能力进阶。

训练逻辑思维

现在是一个读图时代,庞大的数据用结构化的形式展现出来才能更好的得出结论。平时学会运用逻辑图来分析理清自己的思路,用PPT展示观点,这样能够更好的推进项目进度。

正确的思维方式决定了你做事的质量。在训练逻辑思维方面,首推《金字塔原理》。

655037c743ef7d4d864188e43d4238cc.webp


金字塔原理中的归纳推理、演绎推理、相互独立完全穷尽的原则都是训练逻辑的有效方式。再者可了解SMART、5W2H、SWOT、4P等理论,可以运用这些方法刻意的练习自己对数据的分析。在进行操作之前,最好可以画一个思维导图,这样可帮助我们把各个分散的点联系起来,形成一个系统的方法论,帮助我们进行下一步。

深化统计和数据库知识

从统计的角度看数据,会给我们不一样的视角。学会分析数据间的平均值、中位数、标准差、方差、概率、显著性。掌握统计知识中的集中趋势、变异性、归一化、正态分布、抽样分布、估计、假设检验等知识点。如果是多变量多样本,还要学会各种检验。另外,有几个主流的统计分析工具,也可以加深学习:SPSS作为一款菜单式操作软件要比编程性软件入门简单,主要优势在于比较容易上手;R是一款为统计计算和数据可视化而生的软件,它的功能非常丰富;近年来,企业偏好用Python,主要是因为其解释性和功能比较强大。在这方面,Wes McKinney的《利用Python进行数据分析》这本书还比较实用。

9b0262ad2b5fbcaa52fb99cf79deb321.webp


关于数据库,企业数据常常被保存在MySQL、Oracle、Postgres、MonogoDB、Cassandra等数据库中,所以这些也要理解。

学习数据管理和可视化展示

对于海量数据,学会数据管理已经成为一种必备技能。数据管理包括数据的清洗格加工ETL,这样能够让数据更加清晰的展示,比如DataWrangler。数据可视化是为了能够让是数据在前端更形象的展示,比如tableau,spotfire。

目前很多公司都会倾向于选择用数据可视化工具,比如FineBI、易观方舟

9e295e460d76f746e1d12e96dec82e0f.webp

图片整理自“易观数据分析产品——易观方舟”

加强业务实操,向同行学习

俗话说:“实践出真知”。在学习理论和课程的基础上,还需要真正的去操作,在不断的实践中才能更快的掌握技能。在工作中,积极的向同行请教,这样可以更加直接的获取经验。如果能够真正做到扎实学习和勤于练习,相信你成为一个合格的数据分析师将会水到渠成。推荐阅读《精益数据分析》,此书案例较多,涉及业务范围较广,有助于打造你的数据驱动思维模式。

9aead0ad09082abafc7892cba8c3be7b.webp


数字化时代,数据分析思维和数据洞察能力将成为运营的核心竞争力之一。在掌握了以上内容后,在这里再为大家提供数据分析必备知识:


2

Second Point

数据分析的五种类型


在正式进行数据分析之前,我们需要弄清楚数据分析的5种类型。这里总结了5种数据分析的类型,从描述性分析到规范性分析,数据分析的复杂性和工作量随之增加,且越往后越依赖机器。

描述性分析——发生了什么

描述性分析是任何数据分析过程的起点,旨在回答发生了什么的问题,是我们通过对各种来源的原始数据进行整理,再将其转化为对业务有价值的洞察。

通过易观方舟可视化看板,我们可以将采集的数据自定义可视化成线图、柱状图、气泡图等,很直观地看到发生了什么。

5fc054683bbb81ccc58ee1573e15d553.webp

易观方舟数据看板示例

探索性分析——探索数据之间的关系

顾名思义,探索性分析的主要目的是探索,其最典型的应用领域就是数据挖掘。通过探索性分析,能够帮助我们发现原本不相关事物之间的数据变量联系。

数据挖掘领域有一个典型的案例:沃尔玛通过数据挖掘,发现纸尿裤与啤酒的销量数据呈相关关系。于是,调整了超市货架的摆放位置,将纸尿裤与啤酒放在相近的位置,没想到双双增加了这两种完全不同品类的销量。

诊断性分析——为什么会发生

诊断性分析是最常见的数据分析类型。数据分析人员通过诊断性分析能探究某件事情发生的原因,引发这件事情的前置事件是什么,这件事情发生后又会引发什么后置事件。

例如,某天客户电话投诉突然减少:为什么会发生这种情况?通过数据分析发现,可能是因为雇佣了新客服、或者产品的某个界面添加了投诉功能等。

如果能知道某件事情发生的原因以及是如何发生的,我们将能很快确定解决问题以及面临挑战的具体可落地方法。

预测性分析——会发生什么

预测性分析通过分析已知的数据假设未来,回答将来会发生什么的问题。预测性分析不仅会用到前文所提到的3种数据分析类型,还需要用到机器学习(ML)和人工智能(AI)等前沿的数据科学技术。

例如,根据某零售店过去5年的销售数据,我们能预测该零售店下个月、下个季度的总销售额,以及某个单品的销量。

通过预测性分析,不仅可以了解事情的发展趋势、模式以及某件事情发生的原因;还可以根据某件事情在特定领域的发展现状,做出明智的预测。易观方舟内置用户流失预警、商品销量预测等预测模型,大幅提升运营竞争力。

规范性分析——要采取什么行动

规范性分析是最高级的数据分析类型,通过以上所有数据分析,并结合数据模型,回答要采取什么行动的问题。规范性分析会分析多个场景,预测每个场景的结果,并根据结果决定哪个是最佳行动方案。

人工智能(AI)是处于数据分析前沿的规范性分析的例子。人工智能(AI)建立在大数据的基础之上,通过摄取和分解大量的数据,自学如何使用数据信息并做出明智的决策。

我们在进行数据分析时,大多是进行描述型分析、探索型分析和诊断型分析,预测性分析和规范性分析大多交由机器去学习和解决。


3

Third Point

数据分析两个方法:三板斧+双股剑


回到数据分析的实际应用中,不管是产品迭代优化分析,还是运营活动分析等,似乎总会涉及到很多数据分析的方法。

但万变不离其宗,最终总结下来其实都是这5种方法或者他们的交叉组合。如下图所示,易观数科将其总结为数据分析的三板斧和双股剑。

8ee10c722e1e00e7ef27f1d004b141ee.webp

3.1 数据分析的三板斧


趋势分析


趋势分析可以说是最基础且最常用的数据分析方法。通过对有关指标的各期对基期的变化趋势的分析,分析该指标的趋势变化,从中直观地发现问题,让运营决策更准确和更实时。

fdbdb5419190a3760fe9a8bcdb4a7a38.webp

例如,对于品牌零售行业,GMV是最核心的指标,我们就可以根据日、周、月等时间维度描绘GMV的趋势图,这样便可以很直观的看到按照不同时间维度GMV的变化。


细分分析


当趋势分析过于宏观,细分分析则是精细化运营的必备,通过按照不同的维度一步步地对数据进行拆分,不断接近问题发生的起源,让运营获取更加精细的数据洞察。

125a7eeb9cda37cab1cd21590a2cdc5c.webp

例如,某品牌零售企业的GMV某天有明显的下降,那么我们就可以根据全国各省级行政区的维度,细分湖南省、广东省、北京市、云南省等34个省级行政区,查看具体是哪个省级行政区的GMV有所下降。定位到具体的省级行政区后,还可以继续往市级、区级层层细分。


对比分析


对比分析是将两个或两个以上的数据进行比较,分析差异并揭示数据所代表事情的发展变化情况以及规律。其特点是可以非常直观地看出事情某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少,主要是为了给孤立的数据参考系。

d7928376bd69a3f660e49075e7834cd2.webp

例如,同样以品牌零售企业的GMV为例,通过对比不同年份的GMV变化趋势,我们可以很直观地看到这家企业的年度增长情况,判断是否值得投资。


3.2 数据分析的双股剑


溯源分析


追溯到事情的源头去分析,是避免运营做过多无用分析的方法。

举个例子,当一批用户到来我们的产品内,购买转化率比较低。通常情况下我们去分析,可能会围绕产品流畅度的问题、运营活动力度的问题,或者商品吸引力的问题。但很有可能从源头分析,这批用户就并非我们的目标用户,而是虚假流量。


归因分析


通过一种或者一组规则,将销售功劳或者转化功劳等分配给转化路径中的各接触点,即为归因分析。

本质上归因分析都是为了衡量和评估用户触点对总体转化目标达成所作出的贡献,评价的核心指标为转化贡献度。但具体如何衡量和评估,就需要我们用到归因分析模型。

常见的归因模型主要有5种,分别为首次触点归因模型、末次触点归因模型、线性归因模型、位置归因模型和时间衰减归因模型。关于归因分析的详细文章可跳转运营的还不懂归因分析?难怪你的增长停滞不前



Analysys

关于易观数科

易观数科是国内专业的一站式全场景私域用户运营解决方案服务商,旗下拥有易观方舟智能分析、易观方舟智能运营、易观方舟智能画像三大产品组件及配套咨询服务,帮助企业沉淀数字用户资产,打造数据驱动运营闭环,建立私域用户亲密关系,实现精益成长。

点击「阅读原文」免费体验方舟产品

↓↓↓ 
浏览 17
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报