从技术到管理,数据人如何开展工作?

数据管道

共 2515字,需浏览 6分钟

 · 2020-08-27

目录

  • 0x00 先沟通

  • 0x01 再建模

  • 0x02 想分析

  • 0x03 自动化

  • 0xFF 做一名合格的TL

0x00 先沟通

我一直有个观点,数据仓库&数据分析,是一个跟人打交道的工种,而不是技术。

笔者从事2B方向的数据仓库工作,之前面试过不少的同学,有一些机灵的,会在面试之前,简单问一问岗位的内容,我一般也会照实回答。在得知工作内容是2B之后,一些人就表示了明确的拒绝,更希望从事的工作与2C方向相关。尽管我比较讨厌这种情况的出现,但我会表示尊重,因为搞清楚自己想从事的工作方向,比工作机会更重要。

为什么会说工作方向更重要?因为大多数数据人,所从事的工作内容,都是与业务相关的。并不是说技术方向不可以,而是纯技术的岗位,招聘的人数远比业务岗位少得多,而且要求高得多。出于现实的考虑,从事业务方向的开发,就是大多数人的通常选择。业务开发,说到底,就是要实现业务价值的,而业务价值,并不仅仅指导出报表,也不仅仅指做一个架构完美的数据仓库,而是要产出切实的业务价值。技术人通常比较羞涩,不愿意过多的跟人打交道,那么产品/运营,甚至是老大的很多想法,就很少去了解,到了汇报的时候,往往被质疑的怀疑人生,也就不足为奇了。

工作方向,说到底,就是你感兴趣的,并且能够有动力去跟别人聊下去的爱好。

我并不想多谈业务价值该怎样实现,成功的人思考问题的方式都是类似的,而底层的码农做事的方式却各有各的风格。但实现业务价值的一定要多跟别人交流,思维多碰撞才能产生火花。即便是你在某个领域深耕多年,不交流也很难继续跟上时代的发展。

因此,先锚定自己的兴趣点,并不是指技术,而是指从事的业务方向。在这个基础上,多沟通、多交流,数据人才算是开展了数据工作的第一步。

0x01 再建模

建模的作用,是用来描述清楚当前的业务场景。

建模通常是数据仓库应该做的事情,而数据仓库通常是面向过去的,以描述数据的流动性为目的。数据仓库有几种经典的数据模型:范式模型、维度模型、DataVault。在实际的工作中,不管采用哪一种模型,能够把当前的业务场景讲清楚就可以了。

例如你所从事的行业是2C方向的,那么维度建模就很合适,因为维度能够很好的描述历史状态的变化情况,用事务事实表和快照事实表,能够满足绝大多数的建模场景。但假如你从事的是2B的行业,那么单一的模型就可能适应不了,例如企业管理,通常主数据是以范式建模的方式组织的,或者是星型模型,这时候基础模型就要根据数据库来构建。但很多分析的场景又需要关联其他的数据,例如财务、法务数据,这时候又需要做一些维度建模来分析公司的运行状况。

但建模也不是绝对的,建模本质是你对于商业运行模式的思考,对于数据在其中流动方式的总结。

0x02 想分析

分析的作用,是用来产出有价值的洞察报告。

例如我们在构建宏观矩阵的时候,描述的是公司业务线和对应的数据状况,其行、列一般对应着业务主题和数据主题。业务主题包括了公司所对应的业务线布局,例如电商、游戏、视频、应用商店、新闻资讯和浏览器等;数据主题根据抽象程度和视角的不同,对应了相应的业务形态数据,例如曝光、点击、消费、播放、分享等,又可以通过这些原生的行为进行衍生计算,例如留存、活跃、流失等。

我们每次在启动一个新的项目前,都需要做一个行业的调研,了解业界关于这个项目的解决方案,在分析具体的数据前,其实也要有对应的调研过程。数据分析与公司的商业模型比较强绑定,数据分析应该以数据的关联能力为突破口,将复杂业务过程,以透传和洞察能力展示出来,匹配到管理者的期望值中。

可以说,数据来源于业务,并反作用到业务中,还是逃不出商业价值的牢笼。

0x03 自动化

自动化,也可以叫做平台化&流程化,是指把已经成熟的分析/计算方法,做成一套固定的方案,后续有类似的场景能够再次使用,提升业务价值复用的能力。

自动化的目标,不仅仅是为了节约时间,更是为了将已有的方法论固化下来,后人能够在前人的基础上,做进一步的迭代升级。业务所普及的Hadoop等框架,本质也是后人不断提升前人的工作成果,最终形成一套完整的生态。

以数据中台为例,它的发展有三个阶段:描述阶段、分析阶段、预测阶段。刚开始的时候,一无所有,快速把现有的数据进行整合和建模,就非常重要,这个阶段能够理清楚业务细节就是最大的胜利。在此基础上,随着业务边界扩张、业务逻辑逐渐统一的前提下,多进行横向或者纵向的数据对比工作,能够切实解决一批业务价值的问题,并将分析和解决的思路沉淀下来,这里就有了初步自动化的基础。最终当数据流完全数字化及标准化后,引入模型,建立预测机制,将提升业务价值的能力逐步标准化,并且配置成自动流程,这时候数据的智能化场景,就逐步的体现了出来。

0xFF 做一名合格的TL

技术人有两条发展路线:一条是走技术,一条是走管理。其实,在数据的场景下,大多数的技术能力,在阿里P7阶段就已经学会了,而更深一步的技术能力,每提升一小步,所付出的精力和时间,都是之前的一大步,很多人就被迫走向了管理路线,也就是TL。但是,TL所面对的场景非常复杂,管技术、管团队、管业务,特别忙是一定的,又反向迫使很多人望而却步,真正的变得迷茫起来。

TL的核心职责,其实是可以跨团队组织工作,这其中,要想让别人信服,顶层架构、发展分析、落地策略、团队管理、KPI制定、领域驱动、技术驱动、稳定性建设、质量建设、准确性建设、分布式系统、陌生领域知识…… 要学习的内容太多了。数据人,很多时候,走到这里,就30多岁了,中年危机也来了。

其实,我们放平心态,把工作想象成一场长跑,阶段性跑的快不是胜利、跑跑停停也注定落后,最合理的方式,其实是一点一点提升自己,按照自己的节奏,不被工作和生活所带跑偏,坚持下来,你还是比大多数人跑得快。

尽管TL很难,但这是大多数人最切实可行的路线,就像高考一样,过了独木桥,又是一道美丽的风景线。

浏览 9
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报