终于有人把数据岗的职能、工作内容、知识技能讲清楚了

数据工匠俱乐部

共 5391字,需浏览 11分钟

 ·

2022-10-27 20:56

来源:谈数据

“数据岗的职能是什么?核心价值是什么?工作内容有什么?每部分的知识和技能如何获取?

放假回家,一家人围着餐桌闲聊。谈及工作,我妈问我:“你每天都在公司做些什么呀?”
我竟一时语塞,不是因为不知做了什么事;而是因为我们好像做了各种各样的事(维护指标体系、做专题分析、建数据表、建设数据产品、等等不一而足),但却很难简单明了的告诉我妈“我在做什么?有什么价值?”。
顿时感觉有点沮丧,因为“一件事情如果我没办法跟我妈讲清楚,说明我自己没有思考清楚。”。

‘数据岗的职能是什么(做什么工作)?(对公司)贡献了什么样的价值?’是一件非常重要的母题”我说时来不及思索,但思索之后,还是这样说。

因为一旦思考清楚这个母题,对个人而言,就可以回答个人成长与职业规划的问题;对组织而言,就可以回答能力发展与组织建设的问题。


为什么这么说?

图1:个人与组织待解的问题

因为工作的最小单元是一个个的任务。相似的任务聚合在一起,形成了职能;相关的职能组合起来形成了岗位。相关的岗位组合在一起,形成了部门;所有的部门组合在一起,构成了组织。

图2:知识技能、职能岗位、部门组织之间的关系

而对个人而言,待完成的任务,决定了所需的知识技能;所以弄清楚数据岗的职能,以及自己想要履行的职能,就可以明白自己要掌握哪些知识与技能。即,解决了个人成长的问题。从承担单一职能,到承担多个职能(职责扩大化),到职能丰富化,进而到承担主要的协作职能(管理职能),就是职业规划与职业发展的一种路径图。

而对组织而言,明确哪些是需履行而目前未履行好的数据职能,就能明确能力发展的方向;对职能的重组和对岗位的重组,使得整体的工作更加顺滑、高效,就是一定程度上的组织建设。

PS:
这里以职能为主要的颗粒度,是因为:不同的组织由于实际状况的不同,对于相同名称的岗位,会设计不同的岗位职能。
“数据分析岗”在目前阶段就是一个非常典型的例子,在有些组织,这个岗位会归属与独立的数据部门,而有些组织内它会归属于业务部门(产品/营销/研发/等等)。在有的组织内部,对产品、运营等等岗位有不低的数据能力要求;而在有些组织内,则并非如此。这些现象的本质是不同的岗位设计,不同的职能组合。
这也是为什么,有的同学说,在他们公司,数据分析师从不跑SQL;有的同学说,数据分析师要懂数据产品设计;有的同学说,数据分析师要熟悉各类算法;等等。这些同学说的都对,都是实际情况;但这不意味着数据分析师什么都要会,什么都要懂,什么都要做。



一、核心职能:数据岗位的核心职能是什么?


谈到数据岗的工作有哪些,大家的脑海里肯定会浮现出特别多的词:ETL、取数、做报表、专题分析、指标体系。绩效管理,不一而足…… 但是究竟什么才是数据岗的核心职能?如何通过一句话总结性地告诉父母,我们在做什么工作呢?

图3:数据岗的工作事项

笔者认为,数据岗的核心职能有两个:① 产出数据资产;② 提升信息的价值密度。

  • 数据资产:所谓数据资产,是个人/企业所控制的,预期会带来未来经济利益的数据资源。这种资源可以是以物理形式存储,例如文档资料;也可以是以电子的方式记录,例如电子文件。

  • 价值密度:所谓价值密度,是指一个数据集预期可带来的经济收益,与其数据量的比值。这里的数据集,可以是51字节的一句商业判断,也可以是3M的数据分析报告,也可能是PB/EP级别的数据库。

我们不妨一起来检验一下这个定义:

图4:典型数据工作的职能归属


“千举万变,其道一也。”——《荀子》
现在,我们弄清楚了数据岗的两个核心职能。那么这两个核心职能对于组织(企业)而言,有什么样的价值呢?


二、生产关系:数据职能对于组织而言贡献了什么价值?


两个核心职能,对应了组织的两个核心能力:
  • “产出数据资产”是一个量化业务的过程,对应着组织“业务数据化”的能力。

  • “提升信息的价值密度”是一个驱动业务的过程,对应着组织“数据业务化”的能力。

简而言之,数据职能在组织中贡献的价值就是:量化业务与驱动业务。

图5:数据职能的价值

这么说稍微有点抽象,这里以问答社区(知乎)为例,简要说明一下“业务数据化”与“数据业务化”的含义。

大家可以稍微回忆一下:当我们在访问问答社区(刷知乎)时,都会产生哪些行为?

简单列举一下,例如:阅读、播放、点击、滑动、跳转、点赞(双击屏幕即刻体验)等等。这些用户的行为,都可以归属为知乎运营业务中的一部分。

而知乎记录这些“用户行为”的过程就是一种“业务的数据化”。但如果仅仅是用一个又一个的分区,记录这些行为日志,只是产生了数据,而没有产生价值。

当知乎加工、分析、利用这些数据进行产品设计,对用户进行信息推送时,就完成了一个“数据业务化”的过程。

图6:“业务数据化”与“数据业务化”案例示意
在上述的例子中,相较于数据业务化,业务数据化好像是一个相较而言比较简单的能力,涉及的主要工作事项就是数据埋点和落库
但实际上“业务数据化”并不简单。仅仅是一个页面的PV的统计,就要考虑、是否弹窗、用户是否切换Tab、是否最小化窗口,等等实际操作场景;最终,可能要经过长时间的多次迭代,才能得到一个较好的埋点标准。

通过“业务数据化”和“数据业务化”,组织可以建立起一个正向的闭环数据流。在这个正循环的过程中,数据越用越多、越用越好。

图7:闭环数据流


三、知识技能:各岗位有哪些数据类工作,需要哪些知识技能?

在明确了数据职能在组织中的价值之后,我们最后来回答关于个人职业发展的问题:数据分析如何入门?数据岗需要储备哪些知识与技能?如何成长?

我们常说,有些事是我们擅长的,有些事是我们热爱的,有些事是这个世界所需要的。而我们职业发展的目标就是找到这三者的交集。

图8:职业发展的目标

所以:

  • 首先我们要弄清楚组织需要各个岗位做什么工作。在了解工作内容之后,我们就可以对自己是否感兴趣做一个初步的判断。当然很多时候,还需要通过尝试的方式,去探索自己的兴趣。

  • 然后,我们根据工作的内容来补充自己的知识与技能,逐步从入门到精通。

1
数据岗位的工作内容

前文提到, 公司的目标是通过“业务数据化”与“数据业务化”建立起一个正向的、闭环的数据流。

而数据岗的工作内容,抽象而言,就是支撑起整个数据流运转;具体而言可以分为:生产数据、处理数据和消费数据三大模块。

下图简单示意了,不同岗位在数据流中所处的位置:

图9:不同岗位在数据流中所处的位置
PS:以上仅为示意,不同企业可根据实际状况进行调整。

因为很多同学,对数据分析师的工作非常感兴趣。这里以阿里集团为例,简单介绍一下中台数据分析师日常的工作内容。

在阿里巴巴,中台数据分析师的日常工作中,主要的交付物有6类

  1. 开拓新的数据源

  2. 产出表资产

  3. 沉淀分析方法论

  4. 搭建与维护指标体系

  5. 建设与维护数据产品

  6. 输出商业洞察

图10:数据分析师日常工作中的主要交付物
  • 开拓新的数据源:例如,信息爬取、竞对分析等。

  • 产出表资产:例如,在DWD(明细数据层)的基础上,建立DWM(数据中间层)和DWS(数据服务层)的数据表。
  • 沉淀分析方法论:例如,指标拆解异常监控因果推断等。
  • 搭建与维护指标体系:例如,指标设计指标体系建设等。
  • 建设与维护数据产品:例如,指标管理系统、数据报表、数据看板、分析引擎等。
关于“临时取数需求”,好好将其归属与“数据产品”这一个工作分类下。这是因为:找分析师跑SQL取数的根本原因,在于数据产品没有建设好,或是没有建立起良性的合作机制。进而导致了各方需要“绕道”数据分析师这个“产品”来取数。
  • 输出商业洞察:如分析报告等。

这里再简单介绍下其他岗位的工作:

○ 数仓工程师的主要工作包括生产与加工数据。

  • 生产数据:比如埋点设计,将业务事实转化为数据落表等。

  • 加工数据:比如数据治理,通过ETL的流程,保证数据的质量。或是数据架构设计,使得数据的存储、加工、调用等有保障的同时,控制成本与风险等。

○ 算法工程师的主要工作包括加工和消费数据。

  • 加工数据:比如用户打标,通过算法对用户原始的数据信息进行加工,进而给用户打上标签,描述TA现在可能的状态,或是未来可能发生的行为。

  • 消费数据:比如算法推荐,基于用户的历史数据,给出推荐。或是时序预测,对未来的业务状况进行预测,进而作为决策的依据。

○ 用户研究岗的工作内容涉及到生产和消费数据。

  • 生产数据:比如调研问卷、焦点访谈等。

  • 消费数据:比如消费者洞察报告、UI设计建议等。
其他岗位,好好在此就不一一列举说明了,因为不同的公司,对相同岗位也会有不同的职能安排。以上介绍也仅为抛砖引玉,还望有不同看法的同学,不吝赐教。
但方法是可以复用的。当你在开展工作时,可以分析一下,你所在的公司的数据流情况,以及不同的岗位,在整个数据流中承担的职责与贡献的价值。

希望以上的介绍,能让大家对数据岗的日常工作有一个简要的了解。

2
数据岗所需的知识与技能

就工作内容而言,这中台数据分析师的工作既涉及到“业务数据化”(开拓数据源、表资产),也涉及“数据业务化”(指标体系、分析方法论、数据产品、商业洞察)。所以说,所需的知识与技能是比较广域的。

根据这6类工作内容,我们来逐一梳理一下数据分析岗所需的专业知识与技能:

通用的职业技能,如沟通方式与方法、时间管理、预期管理等,好好在此不多赘述。
1
 开拓新的数据源
  • 知识方面:学习搜索技能、积累公开数据源的路径、掌握竞对分析的方法论。如有余力,可以学习一些用户研究相关的知识,如调研问卷设计、访谈设计等。

  • 技能方面:如有余力,掌握一些初步的爬虫技能;至少知道什么信息可以通过网页爬取的方式获得。


2
 产出表资产
  • 知识方面:学习基础的数据库相关知识。有志于更深入了解数据资产管理的同学,可以看看《一本书讲透数据治理》、《华为数据之道》等为切入点。
  • 技能方面:掌握SQL。在有基础编程与数据库知识打底的情况下,可以直接通过牛客的SQL题库边练边学。搜索引擎是一位很好的老师,何况工作之后也大多数时候是面向Google编程。

如果暂时还没有基础的编程知识,可以考虑通过北京理工大学,嵩天教授的《Python语言程序设计》入门。学习曲线非常适中。
3
 沉淀分析方法论
  • 知识方面:需要有一些数学/统计学的基础知识,并且掌握一些通用的逻辑思维方法,如金字塔原理等。如有余力的,可以学习一些算法模型相关的知识,如回归、分类、聚类等。

  • 技能方面:掌握一些处理数据的工具,如Excel、Python等。


4
 搭建指标体系
那么怎么理解“理解业务”这件事呢?
好好也没有想到一个非常好的形式上的定义。这里好好给一个举例式的定义:如果你是一个保险从业者,最基本的要求是知道“一张保单是如何流转的”。如果你是一个电商从业者,最基本的要求是知道“消费者从登陆到交易完成的整个链路是怎么样的”。

5
 沉淀数据产品
  • 知识方面:掌握一定的数据可视化相关的知识,在此推荐电子工业出版社出版的《数据可视化》。对于数据治理相关的知识,可以参照上文提到的《数据中台》《大数据之路》《华为数据之道》等;如要更加深入的介入数仓建设,可参阅Kimball的《数据仓库工具箱》
  • 技能方面:掌握至少一样BI看板设计工具,如FineBI等。如有余力可以学习一些产品设计原理,如尼尔森十大可用性原则等。


6
 输出商业洞察
  • 技能方面:掌握一些基本的PPT制作方法,即保证一定的美观性、又提升工作的效率,最重要的是保证信息传递的有效性与高效性。当然,在实际工作中,直接套用模板是非常省事的。


四、小结一下

  • 数据岗的核心职能:数据岗的核心职能有两个,第一,产出数据资产;第二, 提升信息的价值密度。

  • 数据职能的价值:通过数据量化与驱动业务,帮助组织实现“业务数据化”与“数据业务化”。进而,建立起一个正向的闭环数据流,使得数据越用越多,越用越好。
  • 数据分析岗的工作内容:① 开拓新的数据源、② 产出表资产、③ 沉淀分析方法论、④ 搭建与维护指标体系、⑤ 建设与维护数据产品、⑥ 输出商业洞察。
  • 如何积累所需的知识与技能:任务驱动、目标导向。


免责声明:

本公众号所有分享的软件和资料来自网络收集和整理,所有文字和图片版权归属于原作者所有,且仅代表作者个人观点,与数据工匠俱乐部无关,文章仅供读者学习交流使用,并请自行核实相关内容,文章内容涉及侵权,请联系后台管理员删除



(欢迎大家加入数据工匠知识星球获取更多资讯。)


联系我们

扫描二维码关注我们

微信:SZH9543
邮箱:ccjiu@163.com
QQ:2286075659

热门文章


《非结构化数据管理与企业数字化转型》圆桌论坛:从意识唤醒到标准建设释放非结构化数据能量


如何进行湖仓一体架构设计(企业级数字化方案)


【读书心得】黎甜《结构化思维》-咨询顾问常用的8种思维模型


如何在咨询业扩大你的影响?


管理咨询是怎么定价的?

我们的使命:发展数据治理行业、普及数据治理知识、改变企业数据管理现状、提高企业数据质量、推动企业走进大数据时代。

我们的愿景:打造数据治理专家、数据治理平台、数据治理生态圈。

我们的价值观:凝聚行业力量、打造数据治理全链条平台、改变数据治理生态圈。


了解更多精彩内容




长按,识别二维码,关注我们吧!

数据工匠俱乐部

微信号:zgsjgjjlb

专注数据治理,推动大数据发展


浏览 57
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报