我的数据生涯没有规划
自己2004年毕业后进入公司,今年已经是第16个年头了,我也是数据岗位的老兵,从未离开过数据这个专业,现在回头看,在一个专业领域深耕固然重要,但过犹不及,总是会进入舒适区,从而影响了进步,同时视野会受到限制。
比如我没有做过真正的架构师和程序员,因此对于DevOps的理解也是很肤浅的,云原生这个概念在2年前我都不知道是怎么回事,这对于我未来去做大数据技术创新是一种限制。
比如我没做过市场,没有真正的面对过客户,现在要用大数据去支撑对外变现的时候,换位思考就会差一点,前几天我在群里问:运营到底是什么,虽然很多人做了回答,但很难说自己能理解透彻。
我有大量搞不清的概念,比如运营和营销有什么区别,营销和销售什么区别,运营和售前有什么区别,产品运营和业务运营有什么区别等等,诸如此类等等。
有点遗憾的是自己经历少了点,这限制了我的视野,也影响了我的格局。个人的职业发展总是会受到自己的背景和经历所限制,下面就简单讲讲自己在职业发展各个阶段的一些体会。
1、初出茅庐
刚进公司的时候我跟很多人一样冲劲十足,1年时间内成为一名独当一面的取数人员,2年时间内成为一名报表开发人员,再然后成为一名需求管理人员,最后成为一名数据仓库的项目经理,这段经历大概是五年。
取数是做数据的基本技能,报表让你理解了基本的数据表达方法,需求管理提升了业务视野和沟通能力,做数据仓库项目经理让你对于数据平台有了充分的理解,什么ETL、数据建模、数据库、元数据、数据质量管理、数据集市、OLAP、即席查询等等。
很多人没有机会去做这么多类型的数据工作,因此对于数据技术的认知是有缺陷的,而要用数据去驱动业务,并不是靠简单的一个数据技能就可以搞定的,自己微信公众号的数据文章的覆盖面还是比较广的,这跟我的这些经历有关。
但接触的多并不代表认识的深,在理解企业的数据方面我是下过苦功夫的,这是最简单的事情,只要你愿意花时间,但很多人好高骛远,连这么简单的事情也不愿意下功夫。
我实习期间把企业的报表指标全部看了遍,然后编写了第一本数据字典,做大数据后,编撰了企业的第一部BOM三域数据字典。
我也不满足于仅会取数,会刨根问底理解清楚数据仓库每张表是怎么来的,经常跑到业务系统的开发人员那里问问源表这个字段是什么意思,知其所以然可以触类旁通,让我取数能力强那么一点点,当然喜欢刨根问底跟以前的学习习惯有点关系。
出身浙大,求是创新总是要铭刻心中。
上个好的大学对于初期择业有好处,但对职业生涯更有影响的则是思维方式和做事方式,学习成绩好的人当然不能说能力高,但成绩好的人从统计学的角度看一般学习习惯会好一点,比如更愿意打破砂锅问到底。
我曾经总结过运营商大数据的四个特点:全面性、连续性、多维性和完整性,没有足够的经历,你就很难看破本质,人家客户只要稍微深入的问一下就露馅了,这是我后来作为一名数据专业人士跟一名非数据专业人士的区别。
然后我成为了一名主管。
无论如何,没有主动性肯定是不行的,你以前的习惯也制约着掌握技能的深度,但即使有了这些,很多学生到了单位后马上也会进入瓶颈期,当然也包括我。
2、瓶颈期
初出茅庐的成绩靠的往往是以前的惯性,但马上就会进入瓶颈期。
回顾进入公司的第5至第8年,自己的能力基本是停滞的,并不是我主观意愿上不想进步,对于自己知道的不知道的东西,我还是会想办法去提升的,但对于很多东西,我根本不知道自己不知道,我是很难提升的。
舒适区是大多数人都会碰到的职场黑洞。
可以肯定的是,当时我认为自己干的还行,高看自己一眼是人之天性,就好比每个人都想当然的认为自己的驾车水平在平均值以上一样,可惜的是别人往往不这么看。
比如你认为很重要的东西也许在领导那里不值一提,庄子在【秋水】中的那句“夏虫不可以语冰”说得很好,每次开会你想表现却发现别人根本不当一回事,这就是高看自己的典型表现。
再举个例子,你就能够理解什么叫视野的局限。
做经营分析系统的时候我们做了很多的模型,然后会兴致冲冲的去一线推广,比如开个推广会啥的,但发现效果有限,就会想不通,为啥这么好的模型不用呢,准确率很高啊。
经历了多次失败后,终于发现一线似乎更关心覆盖率,准确率低一点其实没关系,因为成本还是有的,too simple,too young了吧。
然后努力去提升覆盖率,发现一线还是很少有人用,就又想不通了,为啥这么好的模型还没人用呢?
又经历了很多次失败后,终于发现一线似乎习惯于按老方式去取数,要改变他们的习惯,替代成本很高。
然后去汇报领导,说能否跟一线的领导沟通下,自上而下进行推动,打破习惯还是需要一些强制力的,但一线还是半推半就,领导也很忙,哪有时间一直盯着。
经历了很多次失败后,终于发现靠人去推动效率还是太低了,模型一定要嵌入到营销的流程中才能在生产中发挥出更大价值,因此就去努力打通平台的流程,希望降低模型的使用门槛,但发现效果还是有限。
然后发现模型的精准度在很多营销价值贡献链中的占比其实很低,人家有那时间还不如营销术语提升下,营销政策换一下......。
更为关键的制约因素也许是:企业数据驱动业务的文化。
换做你,觉得要经历多少次才能领到这些道理,然后找到提升的方法,这些大都还不是技术的问题,解决的办法已经超越了你的认知范围。
你其实不知道自己不知道,如果没点毅力,也许失败了2次就放弃了,根本没有所谓的B选项。然后你就在那呆着吧,这是每个人都会碰到的瓶颈。当然有个好的导师另说,但这又是可遇而不可求的,现在我在团队里持续加强导师制,也有这方面的原因。
有人在硅谷做过统计,人的职业生涯平均最多有2次升职机会,大多死在瓶颈期。
怎么办?
吴军在【格局】一书中说得很干脆:认命,即尽人事听天命,机会到了(比如时代、行业或企业给予的红利),就要善于抓住,能否抓住就在于自己的认知水平和做事方法,这个只能靠持续的学习,也受限于先天的一些因素。
3、转折期
2012年,大数据概念开始井喷,当时社会上每个人都在讨论大数据,公司也开始尝试探索大数据价值运营,由于自己在负责经营分析项目的建设,离数据很近,根据领导要求就开始去接触大数据,没想到这个成了工作的转折点。
2012-2013年自己一直在琢磨O域大数据如何引入、O域大数据的数据质量稽核等问题,记得为了O域数据的引入进行了大量的前期沟通、调研和汇报工作。
有了一点数据后就开始思考大数据如何变现,当时找了很多的国外运营商的变现案例来研究,也写了很多大数据分析报告来论证,那个时候PPT水平也有了提升。
在这个研究过程中发现了很多自己以前不知道的东西,大数据的视野开阔了些,这是很重要的转变。
2014年,4G使得流量数据大幅增加,我们对于大数据平台的探索也开始了,引入的真正意义上的第一个大数据就是O域的DPI数据,这个时候大量的名词、概念和技术跳出来,倒逼着你去学习。
记得有一次跟公司领导汇报大数据,自己对hadoop,MPP等等新技术都不太了解,才知道自己的技术体系已经远远落后于这个时代了,这几年努力在实践中去学习,也看了不少书,后来开了微信公众号写文章主要也是为了逼着自己学习。
2014年底团队签订了第一个对外商务合同,这是开天辟地的,做数据由内到外在认知上的冲击是很大的,原来对于市场的认识就是一天到晚接需求,现在换了个岗位要去直接支撑对外变现,才发现到市场上去赚哪怕一分钱都是那么艰难。
从那个时候开始,自己对于战斗在一线市场的同仁都抱有非常大的敬意。
2015年,在业务和技术探索到一定时候,公司认为机会已经成熟,就成立了大数据中心,这是一个集商务、产品和数据于一体的组织,公司希望我们轻装上阵,专注去做大数据价值运营,有了组织的保障,终于有机会大干一场。
因此,没有什么既定的路径,时代的需要而已。
4、建设期
新组织意味着新的挑战和机会,大数据中心成立的第一要务当然是归集整个公司的数据,作为数据负责人, 我有机会去重建一套企业级的大数据管理体系,这种机会其实很难得。
很多企业的数据管理做不好是存量包袱太重了,而不是缺乏能力,大家都需要一个机会,我这里列一下这期间做的几个重要事情:
(1)大数据平台的建立,hadoop+MPP+Stream,解决计算存储的问题
(2)BDI交换平台的建立,实现三域数据的梳理和采集,解决数据有无的问题
(3)数据开发管理平台的建立,解决数据开发和开放的问题
(4)数据资产管理体系的建立,解决数据质量的问题
在建设过程中,会碰到前所未有的挑战,比如三域数据的整合,就会牵扯到模型规范的问题,各部门的利益要做好平衡,比如数据开发管理平台,会碰到无缝透明衔接各种技术组件的挑战以及带来的使用体验问题,比如数据资产管理,要能基于企业的实际去建章立制,并把这些规矩嵌入到流程和工具里去。
没有端到端重建过一个平台,你对这个平台的理解始终是有限的,而一个大项目的完成总是有那么1-2个人会冒出来,所谓时势造英雄。因此一旦有机会参与公司的重大项目,就要竭尽所能吧,总能从里面学到很多东西。
2015年-2020年,是大数据的开拓阶段,公司要求不仅要做好大数据变现探索,对内也要支撑好公司的智慧运营,两手都要硬,因此开始了双线作战。
5、对内运营期
大数据平台建设完成后,最大的挑战是没人用,恰恰在这个时候,公司为了实现数字化转型,开始启动智慧运营:即以大数据为驱动、大IT平台为支撑、流程优化和管理完善为保障、改进客户体验和价值创造为目标,推进生产运营转型提升。这给我们大数据的推广运营提供了自顶向下的支持。
团队每年都会努力去申报一个公司级的智慧运营项目,希望借着智慧运营的东风来运营大数据。历年的课题如下:
(1)2014-2015年《大数据管理为核心的精确营销》,做营销平台和模型。
(2)2016年《强化大数据变现能力,探索大数据一体化运营机制》探索对外变现。
(3)2017年《基于数据大脑敏捷支撑一线智慧运营》深入一线,听得见一线炮声。
(4)2018年《以完善数据中台为核心,赋能全省智慧运营和数字化服务创新》,优化数据中台来规模化赋能。
(5)2019年《以“实时、场景、体验”为核心持续提升数据中台能力,赋能客户全生命周期智慧经营》,推进了数据中台实时化及智能化
做大数据人才是第一位的,团队在2014年提出了一个大数据人才的培养计划,希望为公司培养1000名大数据人才,胆子还是很大的,因为前期调研了解到公司会点SQL的只有百号人,后来又陆续提出了星火计划(旨在培养专业建模师),然后是培训体系、互动渠道、电子期刊、建模大赛等的从0到1,这些对大数据的推广起到了作用。
在运营的过程中,大数据平台的内涵不断丰富,数据中台也慢慢起来了,比如原来的数据开发管理平台体验是很差的,没有人愿意来用,现在则成为了数据中台的一个核心,相关数据中台内容可以通过关注我的微信公众号查阅。
那个时候每到年底就绞尽脑汁的想着明年一定要去做些突破性的事情,也是最焦虑的时候,如果想不出就会觉得自己停滞不前了,据传阿里也有类似关小黑屋策划方案的故事,估计都差不多,自己推着自己走的确是很难的。
6、对外产品期
在对内运营如火如荼开展的同时,自己除了负责数据管理,也开始神灯大数据产品体系的建设。
产品是数据价值的最好出口,凡是做数据的人都要努力去理解这句话,以前有同事说自己做了99%的数据工作,但临门一脚不是自己的,感觉非常遗憾,一定程度反映了问题。
假如你做了很多取数,就要想想是否可以做些分析和挖掘,做了很多报表,就要想想是否可以做些工具和产品。
道理很简单,如果你创造价值的方式是靠自己的一份时间去换得一份收获,那就是劳碌命,很难规模化创造价值,而如果你将一份时间创造的价值保留下来,则可以让其在7*24小时都能发挥作用,这就是产品能帮到你的地方。
我们做数据的人,整个生涯其实都在探索价值出口,希望将数据变成信息,将信息变成知识,将知识变成智慧,最终产生价值。但有多少人被挡在了信息到知识这个阶段,从来没有过突破。
而团队竟然有了将数据转化到智慧的机会,特别是神灯大数据产品体系的建设。
那个时候,团队每年都会在世界互联网大会上发布一款大屏产品,无论是客流、天盾、城市实验室啥的,虽然这些产品大多是公益性质,但产品团队慢慢拉起来了,我们的产品经理在关键时刻证明了基于大数据可以做出一些不一样的东西。
从2015年-2020年,在对外不断拓展的商务中,我们有机会在产品上做了大量的尝试,逐步演化出了自己的神灯产品体系,包括四大产品线,喜拓客、慧洞察、信风控、惠民生,当然死掉的产品肯定比现在活着的多。
说实话,数据出生的人,能够有机会去去做产品,那是天上掉馅饼的事情。前段时间自己写了篇文章《产品的天机和成败:我的实践史与俞军的方法论》谈了谈对于产品的理解,那篇文章阅读量虽然很低,但对我很有意义,因为这是我在另一个领域进行的学习和反思。
自己始终持有一个观点,那就是数据产品的核心竞争力来源于数据和模型的差异化,这是我能帮到数据产品经理的地方。
随着对外变现的深入,客户对于数据和模型的要求越来越高,在未来,数据的能力会成为大数据发展的最大瓶颈,这是能预测到的。
而如何引入更多高质量的数据,如何加工好这些数据,这是数据中台的使命,也是团队要优先去解决的。
基本就先说这些吧。可以看到,我的职场从取数到报表,从报表到仓库,从仓库到大数据,从大数据到产品和变现,谈不上有什么职业规划,唯一不变的是:保持谦卑、终身学习、做在当下,其它的就交给时代和运气吧。