浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
虽然把“数据”和“石油”相提并论现在看来还有点匪夷所思,但很多事实正在让人接受这个设定。数据可以模拟飞机飞行,仿真汽车碰撞,不用搞真实的实验,缩短机械开发时间;数据可以训练机器人,让它们闲时端茶递水,忙时抢险救灾;数据可以预测故障,无论是风雪中的高压输电线还是数据中心里娇贵的硬盘,都能在损坏前一刻被察觉替换;数据可以模拟你的声音,复刻你的脸,甚至猜出你自己都未曾留意的爱好;数据还能帮企业调整进货卖货的节奏,安排不同产品的生产顺序。。。
不客气地说:很多靠数据完成的任务,是烧多少石油都做不到的。因为在我们中国,石油储量只占世界的第十三位,这事儿一直让咱们耿耿于怀,觉得自己“地大物薄”;但现在看来,因为你我这样14亿普通人的存在,咱们国家的“数据储量”却遥居世界第一。了解了这个真相,我们才能更客观地评估祖国的竞争力。如果站在未来回望我们的2022年,也许会发现自己正坐在AE86上,在历史的秋名山上排水沟过弯:很多技术先驱已经扛着铁锹冲进蛮荒,像一百年前勘探石油那样,用巨大的热情和信念探寻“数据矿藏”。这些新时代“铁人”的面孔,还没来得及被很多人了解。这些人中,如果只让我介绍一位,我会毫不犹豫地推荐你认识一位大叔——行在。朋友们聊起行在,首先想到的是一个背着登山包,穿着冲锋衣,戴着眼镜的邻家大叔。如果正在看文章的你恰好也是“驴友”,没准过去十几年里还曾在戈壁、高山、峡湖里碰见过他,甚至和他结伴聊过几句呢。不过即便站在对面,你也猜不出,这位面相和蔼的邻家大叔扔掉登山包,换上西装,就会变身成一个身怀绝技的“超级英雄”。当然,不是“掐指一算”那种算命啦,实际上,他带着一群顶尖工程师用了将近20年的时间,搞出一套“大数据勘探系统”,可以把平凡的数据变成精确的预测。如果你开了一家连锁奶茶店,把“进货”、“库存”、“销售”数据放在这套系统中,系统就能明确告诉你的采购部门,下个月大概能卖出多少奶茶、多少冰沙、多少冰淇淋,各种原材料分别进多少货最合适;你把光顾过奶茶店的用户信息、购买记录输入这套系统,系统就能告诉你的营销部门,这10086位顾客是咱们的忠实顾客,发优惠券返利给ta们,肯定能处成老铁;如果把财务、绩效、人力数据放进系统,它还可以告诉你的人力部门,那个每天早来晚走老板们都喜欢的小刘其实是故作勤奋的“卷王”,那个每天低调按时上下班的小李才是真正工作做得好的人,应该给他发奖金。
你看,正是因为这套系统能像“X光”一样“看到数据内部的真相”,所以遵循它的“预言”才会获得实打实的好处。你这个老板不用额外做什么,就能让公司运转成本更低,让顾客得更多实惠,也让员工们更公平。不知道你注意没有,现在一说到“搞数据”的技术宅,一般都比较年轻。那是因为最近几年数据科学火起来之后,有很多人选择了这个职业。事实上,行在是中国数据智能界不折不扣的“史前神兽”,在数据的油田里滚了十几年的“数据侠”。这么说吧,他跟大数据死磕的那些年,全中国还真没几个人能说清大数据是个啥味道。当然,行在也不是一出生就像疯子一样笃信数据的价值。他为此奋斗至今,是因为早年间曾亲眼见证过“神迹”。2004年,上海到杭州的火车上,正在出差路上的小伙子张金银接到了一个陌生电话。电话那边是猎头,问他愿不愿意跳槽到一家叫“阿里巴巴”的公司工作。那时候,淘宝网才成立几个月,什么“互联网巨头”之类的名号根本没有降临在阿里巴巴的头上。所以听完这个名字,小伙子先是一愣,不过他马上搜寻了一下记忆,想起来这家公司不简单。当年,学统计学的张金银误打误撞加入了一家大企业,负责数据库的运维管理,就是俗称的 DBA(Database Administrator 数据库管理员)。世纪初的 DBA,就有点像今天的人工智能工程师,那绝对是令人傲骄的技术岗位,回村吃饭都能坐主位。。。这不,张金银每天都走路带风,业余时间他就喜欢在网上发帖和同行探讨数据库技术。说是同行,其实那时候全国的数据库大神也没几个,手指头加脚指头就数得过来,而且这些人还爱“扎堆”,都聚集在一个叫做“ITPUB”的论坛上。就在2004年前后,张金银发现了一个不寻常的事情:ITPUB 上厉害的数据库大牛有一半都被同一家公司给挖走了,这家公司就叫阿里巴巴。“这么重视数据,这家公司有前途!”他想。他甚至有些暗暗嫉妒,凭神马不挖我?这不,说巴巴巴巴就到,在火车上就开始挖了。张金银赶紧故作镇定地跟猎头说:既然人家有诚意,我愿意去聊聊~加入阿里,最后一场面试的面试官是张瑛,当时阿里巴巴中国区负责人,也是马云的夫人。面试很顺利,告别前,张瑛多问了一句:“对了,你知道马云是谁吗?”张金银老实地摇头。张瑛重新坐下来,给这位小伙子介绍了半天马云是谁。。。没错,小伙子张金银加入阿里巴巴之后,就为自己了花名“行在”。行在就是张金银,张金银就是行在。就这样,在躁动和青涩的杭州城里,行在一头扎进了中国数据智能历史的小溪中。也许他也未曾料到,十几年后,这条小溪将会成为奔涌的大河。彼时听说过“阿里巴巴”的人寥寥无几。酒香也怕巷子深啊,所以首要任务是告诉别人我们这里有宝贝卖!最有效的方法就是——在各大搜索引擎(谷歌、百度)上投关键词广告,把用户吸引进来。然后百度就给出一堆推荐其中就有阿里巴巴的商品链接(这就是阿里花钱投的广告);
但从阿里的角度看,可以投放的关键词有千千万万,T恤、男T、短袖、上衣,还有各种品牌的名字。。。于是,一个大问题摆在面前:到底投哪个搜索引擎,投哪个关键字的广告,才能吸引更多真正想买东西的顾客呢?那就看看从哪个关键词来的顾客买了东西,并且买的东西多呗。但是,时任阿里广告投放负责人蒋芳带着一个7人小团队,却要管理各大引擎总共20万个关键字的投放。这就像七个牧羊人,管着20万只羊,疲于奔命肯定没办法精细地照顾好每只羊。。。可是这广告费不是十块八块,加起来都快几十亿美元了,要是好钢没有用在刀刃上,那浪费多少钱想都不敢想。。。行在当时的任务,就是解决这个问题:从数据里猜出真相——通过对海量数据的计算,告诉团队投哪个关键词最好,投多少钱最合适。1、把能找到的方方面面的数据,有一个算一个,全都汇总在一个系统里;2、然后为各个搜索引擎里20万个关键词的“效率”高低打分。由于是用计算机操作,不受人手限制,所以打分能做得很细致,相当于牧羊人对每只“羊”都能照顾到;3、接下来,系统就自动投放广告,根据返回的效果,再修正广告投放的操作。如此反复。
讲真,行在猜到了这波操作会帮公司省钱,但真没想到省了那么多。。。这个“神迹”让年轻的行在热血上头,体内的多巴胺到今天还在奔涌。说到这,你也许有点怀疑:“这不就是从一堆数字里总结出规律嘛!小学奥赛题的节奏啊!行在只不过用计算机代替人工实现了这个操作,就值得如此吹捧吗?”正好借这个问题,我给你介绍一位新朋友——“数仓”。1)在远古时代,先民们就发现了黑乎乎的石油,他们也知道利用石油,只不过利用的方式是直接点燃,取暖照明。(烧石油带来的便利还不及燃烧放出毒气的伤害大。。。)2)而在近现代,人们建设了油田,自动化抽取石油;还建立了石油精炼厂,可以做成汽油、柴油,还能做成肥皂、化纤、塑料。
数据也是一样的道理:同样是从一堆数字中分析出结论,但不同水平的分析,得到的结果可是天差地别。具体到行在当年“分析数据”的那波操作,先进在哪呢?篇幅有限,就说最厉害的一点吧——他尝试把很多”非结构化数据“纳入了计算。淘宝是一个虚拟的百货商店。全世界的人不用受到沉重的肉身限制,想来就来想走就走,所以,会有比“实体百货商店”多得多的人,留下比现实中多得多的“痕迹”。这些“痕迹”通过网页(或手机App)里预埋的“传感器”收集起来,存储成“网页日志”。注意,这种日志并不是像 Excel 那样条理清晰的表格,所以被称为“非结构化数据”。非结构化数据放在电脑里,一条条地参差不齐,就像野地里乱跑的熊孩子,别说分析,就连管都管不过来;要想管好,非得有几位坏脾气的幼儿园老师,每天专门负责把小朋友们揪回班级,排排坐吃果果。这个排排坐的操作,就是把“非结构化数据”归类为“结构化数据”的过程。而能完成这个操作的系统,就演变成了后来很火的“数仓”(当然数仓还有更多复杂的管理功能);而这种把“非结构化数据”纳入计算的模式,就演化成了后来“大数据计算”的经典姿势。上面的描述有点抽象,数仓到底是怎么运作呢?咱们可以想象这样一个画面:要想完成大数据计算,必须先搞一个“数据仓库”,在里面安装各种机械臂、传送带,再养一堆数据搬运机器人,相当于用代码搭建出一套质量极高的“自动化数据治理系统”。最终目的就是:想要找啥数据就能找到啥数据,想要算啥数据就能算啥数据。
不夸张地说,正是因为有了数仓,普通人创造的“鸡零狗碎的零散数据”才能被整理,被利用,有机会成为真正的能源。就像真实世界的“机械臂”“传送带”“机器人”一样,这些“数字机械臂”、“数字机器人”的进阶也是没有止境的——只要不断精进技术,它们总能抓得更准,运得更稳,跑得更快。所以,行在和小伙伴们能把这事儿一干就干二十年,也不觉得腻。认识了数仓和数据智能,再回顾那些年的故事,你就能看到一个和普通人理解中完全不同的历史。普通人看到阿里巴巴的成功是源于对梦想的执著和一次次准确的商业布局;而咱们看到的,却是这家集团背后如圣火一般燃烧不断的数据。(包括今天阿里最为人熟知的计算力系统阿里云,最初就是为了大数据计算而设计的,这个故事我写在了《阿里云的这群疯子》里,有兴趣的浅友可以去看。)
“不得不说,那些年阿里领先了整个时代。”行在感慨。白驹过隙,转眼历史的车轮滚到了2016年,一路勤勤恳恳低头干活的行在已经成为了阿里云数加(阿里数据中台)的负责人。可是,站在自家“油井”上登高望远,他突然发现,世界跟以前不同了。在2004年,数据可是“稀有矿产”,阿里巴巴是国内为数不多的拥有“数据油田”的地方;可是到了2016年,其他企业也开始效仿,无数互联网App如遍地烽烟,传统金融、零售企业也开始在网上撩客户,眼看他们手里的数据也越来越多。
巨大的机会再明显不过——每家企业都需要自己的“数据油田”和“数据精炼厂”,成立一家帮他们用数据的公司,肯定有搞头啊!看到这一层其实并不难,难的是“更上一层楼”,“老炮儿”行在想要押注一把背后的“时代大潮”,那就是:“数据的普惠”。1、如果大大小小的公司都有了数据能力,那不同企业的数据就能用某种方式联合起来计算。这样的联合,绝对不是“1+1=2”,而是“1+1=10”的节奏。2、就像全世界只有5个人有手机,那他们只能相互打电话自娱自乐;但如果普惠到14亿人每人一部手机,就会催生微信、美团这种之前完全想象不到的新生态。
借用物理学上的一个概念:数据越“普惠”,人类的数据文明就越接近那个爆发的“奇点”。所以,行在打定主意创业的时候,都没犹豫,就给自己的公司起名叫“奇点云”。
熟悉这段历史的浅友肯定知道,当时前后脚成立的“数据智能公司”还有很多(那时候喜欢叫“数据中台”),单是从阿里巴巴出去创业的就有不少,但奇点云却是这里面最特别的那个。为啥呢?不仅仅因为行在是“史前巨兽”跑出来创业,还因为他的创业目标和别人不同。说俗一点,因为伴随着阿里黄金时期的成长,行在得到了非常丰厚的财务回报。当时他算了算:“客观上虽说达不到想在哪买房就在哪买房的程度,但余生一直闲云野鹤徒步旅游怎么说也够了。”这就导致“个人金钱回报”并不是他创业的主要目标。。。这里中哥提醒你一句,千万要小心这种不为金钱创业的人,因为他想要的东西一定比钱贵多了。。。果然,当时行在仔细想了很久,确定自己不想做小打小闹的“包工头”,他想做的是“数据时代的淘宝”。这个数据平台,就是我们上一章说的“数仓”。分散存在好多系统里的数据,需要一个“数仓”连接起来,统一调度、管理。无论神马企业都需要这个基础设施,所以“数据平台”是必选项,它就像一个王冠。
在数据平台之上,每个企业想要做的事儿就不一样了:比如有人就想要从自己的用户里找到适合发优惠券的人,比如有人想要看看自己进货销货的过程中还能不能节省点资金占用,等等。就像你我都有手机,但里面装的 App 可是各不相同,有人爱用拼多多,有人爱刷抖音,有人爱上陌陌。。。所以,“数据应用”肯定会因人而异,是选装的。它就像王冠上的珍珠。
奇点云又做王冠,又做珍珠,那么到底是王冠做得好还是珍珠做得好?你要问行在,他肯定会说:两样都做得好。但要让我评价,肯定是“王冠”做得更好。毕竟,在阿里巴巴时代,这群人主要做的就是“王冠”(数仓)。他们对数仓熟悉到啥程度?估计连做梦都能把代码倒背如流。。。这不,奇点云数仓的技术负责人王乐珩就坐在我的面前,他还有个很炸裂的花名:地雷。跟地雷聊了两个小时,我发现他的自我评价很准确。。。不是啥样的公司他都能凑合,更不是啥样的老板他都能“伺候”。地雷想要的,是那种近乎教徒一样对技术的圣洁追求,四个字形容:“技术洁癖”。遥想当年,在阿里巴巴时,地雷就是大数据平台团队的绝对产品和技术主力。后来他先一步从阿里离开,曾在基因大数据领域创业,兜兜转转在2020年又被行在“三顾茅庐”邀请回奇点云成为 CTO。奇点云的数仓名叫 DataSimba。用地雷的话说,这个东西有点像“中央厨房”。要搞清楚这个,咱们得先说说真正的中央厨房是怎么运作的。你每天点的美团外卖,其实制作过程都离不开中央厨房:中央厨房向下,连接萝卜、白菜、西蓝花、茄子、扁豆、西红柿、猪牛羊肉等等几十样原料;中央厨房里,利用大规模的工人分工和机械化加工,用最高的效率生产出半成品;中央厨房向上,连接各个饭店,饭店。他们拿到半成品,只需要简单加工就能做成可口的饭菜,送到千家万户。
数仓向下,连接各种数据库,用户数据、销售、仓储、财务、人事等等几十个数据源;数仓里,利用高效的计算逻辑,把底层数据计算成半成品,例如把数据分好类、打好标签,做到“洗净待用”;数仓向上,就连接各种数据应用,数据应用在“半成品数据”的基础上,只要简单的计算,就能快速得到结果。
1、想要针对它的用户中“住在一线城市”,“年龄30-35岁”,“过去30天曾经在线下店购买过商品”,且“过去30天没有在线上购买过商品”的“女性”来发放优惠券。2、如果这位顾客过去曾经购买过1000元以上的单品,则向她发放200元优惠券;如果这位顾客过去没有购买过1000元以上的单品,则发放100元购物券。
你看,这个要求还挺复杂的吧。(其实在真实的零售商业中,比这个还要复杂得多)这个时候,数仓要开足马力,从各个数据库存储的用户数据里,一条条筛选符合条件的用户,贴好“标签”(当然,数仓也会在平时打好一些常用的标签,此时直接输出就好);然后把这些带有“标签”数据传送给上层的“促销系统”,促销系统再操纵优惠券系统,给一个个具体的小姐姐发优惠券。看上去很简单吧,但刚刚的例子只是“促销”这一个任务。“中央厨房”难就难在:它啥菜都得会做,啥菜都得做好,啥菜都得做得快。地雷告诉我,向下看,数据源可以大概分为五个“域”:向上看,要做的事情千奇百怪——今天要选取目标客户,明天就要预测财务,后天就要算人效。。。一旦你为特定的任务单独框定资源,就如同你的数据车间里摆了很多固定生产线。生产线是多了,但大量的时间,他们都在闲置,白白浪费时间和空间,这么玩就不是数仓,而是一个拼凑起来的“伪数仓”。所以,一定要用“平台思维”来做数仓:把各种可能的逻辑都准确抽象出来,做成模块,然后组合调度。
至于怎么做模块,那就要考验这群技术宅十几年的经验了。这些模块就像乐高积木,它们的分类要恰到好处,既不能造出“异形”的积木,也不能缺少合适的积木。地雷说得这么激动,那 DataSimba 的疗效到底咋样呢?追风是奇点云的合伙人,也是客户实施负责人,说起来,他也是数据智能界的大叔。从1999年开始,他就为零售企业做信息化系统,那时候主要开发 POS 机背后的系统。2018年追风被行在请到奇点云。贴身服务企业这么多年,企业们做数字化转型真正想要的是啥,没人比追风更清楚了。追风给我讲了某国际知名奢侈品品牌的故事。(因为客户敏感,他说就不透露名字了)作为国际大集团,这家公司早就注意到数据的价值,每次做营销活动也都是建立在对数据的充分挖掘基础上。你可能想不到,它们单单客户的数据,就来自七十多个系统,比如天猫、京东,还有官方电商网站,还有公众号,还有客服系统、导购系统、POS机刷卡数据等等。这些数据质量都很高,但就是太分散。每次要做活动,就从存在不同机房里的几十个系统里挨个“捞”数据,把捞到的数据存在一起,然后写脚本代码进行打标签,然后才能把标签数据输出给业务部门去设计优惠活动。问题是,如果下次再搞一次促销,还要重新从数据库里捞数据,写脚本,还得两个月时间。。。
仔细想想,这个操作说白了不就是靠技术人员组成一个“人肉数仓”么?虽然人肉数仓也没什么不行,但里面有两个大坑:一号坑:数据工程师的人工成本非常高,干这种数据整理的活儿用数据工程师,那简直就是高射炮打蚊子,浪费钱。二号坑:这么来一次就两个月,臣妾真的等不起。。。你一次促销还没搞完,竞争对手可能都玩了三次促销了。
追风还记得,2019年的时候,他和同事带着团队去这家集团作部署,把数据都接入 DataSimba。这是 DataSimba 的界面,上面显示了接入的数据源。
DataSimba 取代了手工筛选标签的工作之后,做一次全国促销的平均时间从2个月一下子缩短到15天。这就像从小米步枪直接进化到了加特林机枪,虽然都是开枪,但杀伤力是完全不同的。刚才,我们科普了半天“王冠”(数据平台),那“珍珠”(数据应用)的原理是什么呢?“数仓”对应着把原油抽出来的过程,讲究“稳定、高效、安全”;而“数据应用”就对应着把原油练成汽油、柴油、化纤的过程,讲究一个“精细”。从数据里分析出来的结果一般精确,就像炼出了“93号汽油”;从数据里分析出来的结果极其精确,就如同炼出了“98号汽油”。
98号汽油肯定比93号贵啊!没错,同样是数据应用,其中的算法越精准,提炼出来的价值就越大。说到这,我就得给你介绍一位数据分析界的顶级大牛了。这位大牛,也是很早就冲向数据蛮荒的大叔,只不过,在很长时间里,他和行在并不相熟,而是在各自的人生旅途上孤独探索。他就是业内鼎鼎大名的数据科学家,GrowingIO 的创始人——Simon。在中国,说到“数据精炼”,人们都会想到 Simon,就像说跨栏一定想到刘翔一样。Simon 的中文名是张溪梦,之所以有个英文名,是因为他在美国硅谷工作过很长时间。Simon 曾经是 eBay 的数据分析师,也曾作为主力帮领英公司(LinkedIn)创建了数据分析平台。说到这,其实你应该马上猜到了:这两家美国公司的成长路径和当年的阿里巴巴出奇一致,都是把“精细的数据分析”作为公司决策的重要依据,然后不断做大做强,再创辉煌。只不过,老美喜欢造概念,把这种玩法总结成了一套方法论,名叫“增长黑客”。2015年,在地球对面的 Simon 同样看到了数据时代即将像洪流奔涌,决定挑梁创业。本来他决定在美国创业,团队人选都快落停了。但是最后关头,一组数字进入他的眼帘。第一,当时美国同类型的数据智能公司已经有50+家,眼看要变成红海。第二,在中国,还没有人布道“增长黑客”的概念,赛道内同类公司的数量几乎是0。
这些数字,足够让对数字极其敏感的 Simon 改变决定:为啥不把创业地点改在中国,帮助祖国企业掌握数据科技呢?经过短暂几周的思考,他买了单程机票,回到中国。回到中国之后,Simon 先是把“增长黑客”的书籍翻译成中文,然后成立了创业公司 GrowingIO,用尽全力布道“增长黑客”的理念。很多传统公司和小公司,都是通过 Simon 的布道才第一次理解数据的魔力。这是 Simon 最早翻译的《增长黑客》,也是最为人知的一本。要感受到 GrowingIO 这颗“明珠”的璀璨,我们还得闪回到那个时代。2015年,全中国大大小小的城市都出现了一道奇观,那就是“扫码一条街”。举着毛绒玩具的青年男女荷尔蒙奔涌,无数从未听说过的 App 开始玩命抢占人们的手机屏幕。普通人感受到的是移动互联网的春天。但普通人感觉不到的,其实是背后一场残酷的“数据战争”。当时,互联网巨头的霸主地位已然稳固。就拿淘宝来说,它是零售电商领域绝对的王者。无数品牌商家(尤其是中小品牌)必须把商品放在淘宝上才能获得大卖的机会。这时,一个忧桑的现象出现了:你的商品可以自由放到淘宝上卖,但和销售有关的数据不能自由回到你手上。实际上,你得花钱从淘宝购买才行。结果就是:没有数据,品牌商就没办法使用“增长黑客”的技术改进自己的销售,搞来搞去,对平台的依赖反而更重。(这也是后来平台反垄断的基本逻辑)很多零售品牌商看到了移动互联网背后的“数据机会”,他们通过自己做 App,就有机会绕过大平台,直接和顾客建立联系,把数据收回来,把分析的权利夺回到自己手上。而他们环顾四周,GrowingIO 恰恰就是那个帮企业提供“用户行为分析”、“营销自动化”工具的最好选择。这就是一个网页的点击热力图,这背后的大数据里隐藏着营销的秘密。
这里我插一句:在很多人的意识里,“数据分析”会造成对顾客的侵害和打扰;但如果客观分析,结论可能有些反直觉。在没有数据分析的情况下,商家也不可能不营销(不营销就死翘翘了)。那时他们会采用无差别的营销,就是对所有消费者都推荐产品,这样必然会打扰那些不想买东西的人;但有了数据分析,商家就可以精准地对需要某个东西的消费者进行“提醒”或“促销”,这样的结果是:想买东西的消费者不会觉得被侵犯,反而得到了优惠;不想买东西的消费者也不会被无端打扰了。
说回我们的故事,那场移动互联网的春天很短。泡沫快速涌起,也快速跌落。由于经验缺乏、商业模式的不成熟,当初生长出来的 App 绝大多数没能活到今天。GrowingIO 也和很多创业者一起走进了寒冬。但 Simon 却没想认输,他打定主意,继续等待机会。故事来到了2018年。那年年底,微信推出了一个叫做“小程序”的玩意儿。小程序和“数据战争”有啥子关系呢?大多数人还没看懂的时候,Simon 已经恍然大悟:品牌方和线下零售店都可以通过小程序来开发自己的购物页面,人们能从页面上下单,也可以添加商家的企业微信。这样一来,品牌方和用户直接建立了联系,也能把数据回收,用于促销和服务。(这就是人们常说的“私域流量”)
用“小程序”和“企业微信”来做营销的方式蔚然成风,GrowingIO 找到了新武器,于是,他们把数据分析的主战场挪到了小程序上。虽然从商业战场上杀出一条血路,但我们把时间拉回到2019年, Simon 却开始面对一个技术困境。GrowingIO 的数据分析能力世界顶尖,但随着分析的数据越来越多,来源越来越丰富,必须能对数据有极其精巧高效的调度。说白了,GrowingIO 缺少一个世界级水准的“数仓”。讲到这,Simon 和行在的故事就快走到了交汇处。现在,我们把镜头转回杭州城。2020年的行在还在一如既往地和同学们埋头打磨数仓技术,完全没有意识到一个巨大的坑正在面前等着他们。2020年春节前,行在谈妥了一桩大事:新一轮融资敲定,过年之后就会进账了。于是,他踏踏实实给大家放假了。新冠疫情来了;公司不能去了;所有业务暂停了;投资人不投了。要是放在其他年份,眼前的困难还没那么魔幻。可是好巧不巧,奇点云当时账上现金已经用掉了七七八八,就等新的融资到账呢。。。那年春天,连着好几个月都是“0新业务”、“0回款”。
年前公司还好好的,谁能想到年后已经快到没钱发工资的状态了。。。一贯性格冷静的行在也没办法继续淡定了。他火速找到投资人求助。可对方的意见是:帮忙可以,但是得裁员一半+全员降薪。当时奇点云已经有300多位同事了。一来行业正在爆发,正是需要同行者的时候;二来同学们都有家要养,有房贷车贷要还,说裁员就裁员,行在是真的做不出来。当月,奇点云管理层停发工资,行在和其他几位合伙人把房子抵押、拿出存款发工资;然后,他们戴上口罩,全部冲到一线跑业务,就像创业第一天那样。行在给相熟的客户们挨个打电话,可是疫情当前,人家公司的业务也暂停了,爱莫能助。行在只好挂断电话,长叹一声。就这样,时间一分一秒地过去,眼看抵押房子的钱也只能再撑一个月。。。为了保障复产复工,杭州余杭区政府想要建立一个防疫物资的复工平台,目的是让普通市民都能买到口罩。这个平台对稳定性要求极高,而且要得非常急,必须在一周之内上线。倒数开始,滴答滴。。。说起来,就在两年前,奇点云曾经帮助政府做了一个企业服务大脑,那个项目效果非常炸裂。更关键的在于,通过那个项目,奇点云对政府各个数据库的格式、接入的方法都有现成的经验。这个时候让奇点云来做,最能保证速度和质量。只要奇点云能快速拿出方案,通过技术汇报,拿下项目就很有希望。然而,汇报的时间安排得非常紧,当天才获知。没工夫多想,生死在此一搏,行在和联合创始人刘莹从各自小区拿着出入证出来,开车冲上了空空荡荡的大街。有点像拍电影不NG,没机会给你反复揣摩,必须一条过!
果然,复工复产平台的建设任务交给了奇点云。分散在全国各地的三百多位同学听到这个消息,在群里炸开了锅。技术、产品、交付,各个岗位的男男女女在各自的老家里开始了一场“全国大协作”。当时,很多需求都来不及写详细的文档,这边靠口述,那边靠理解。流程来不及做到规范,考验的就是老司机们的“手感”了。工程师们在各自的城镇、乡村里,面对电脑,瞪大眼睛,手里噼里啪啦,毕生的功力都在这一刻灵魂附体。由于远程协作,要时刻开着视频,没网的地方就要用手机热点,这时候也顾不上心疼流量了。大家还记得,经常开着会,背景里就出现某位同事的母上大人在背后喊“儿砸吃饭啦!”,要么就是正讨论到关键时刻,同事家的小朋友拿着作业乱入,求爸爸给讲题。。。。这些插曲都没能挡住老司机们狂奔的步伐,几天后,平台如约上线,而且稳定运行。数据统计很快就返回来:11天之内,平台供应了口罩3935717只;25天之内,帮助了2742家企业的64463人复工。看着工资都顺利发到了大家手上,行在心里长舒一口气。说实在的,之前我确实没有操心过公司账上有多少钱,投资人笑话我是“老干部下海”。疫情之后,我要求财务每周都向我汇报公司财务状况,成了真正的 CEO。
有了前车之鉴,2020年行在还火速敲定了几笔新融资,迅速把现金储备拉到安全水位。多说一句,地雷就是在疫情最紧的“至暗时刻”加入奇点云的。虽说之前行在三顾茅庐邀请地雷,但地雷却偏偏选这个档口打赢要来。“公司都生死未卜,可别坑了兄弟。。。”行在想。于是行在反而开始“好言相劝”:我们状况很不好,你现在的公司马上要上市,有股票拿,要不你再想想。。。。地雷大手一挥:不用想!好不容易最近老婆被我说动了,我可不能错失机会!结果,地雷刚刚加入,奇点云就拿到了余杭区的项目,现金流迅速回血。地雷回忆当时的情景,还意犹未尽:“我本来是准备共克时艰的,结果至暗时刻太短,不太过瘾。。。”讲真,听到他说这话,我都没忍住笑。这样一群数据疯子,着实不好用正常人的思维来理解。。。刚从“至暗时刻”的坑里爬出来,这群数据疯子就遇到了另一群数据疯子。2020年时,数据智能的行业已经日趋成熟。客户们对于要买啥产品心里都有数了。很多客户在用奇点云的皇冠(数仓)的时候,都会选择 GrowingIO “用户行为分析”这颗好用的珍珠(数据应用);而GrowingIO 的客户如果想要连接复杂的底层数据,第一个就会想到用奇点云的数仓。奇点云和 GrowingIO 虽然没有官方合作,但在客户那里经常被嗑成一对 CP,配一脸。行在看到这个情况,感觉不一般——奇点云应该找机会和 GrowingIO 深度合作!可合作毕竟是两家的事情。行在开始有点害羞,不知道 Simon 是个啥性格,于是先让刘莹去找 Simon 探探口风,没想到,Simon 一口答应和行在见面详叙。我发现我们和 GrowingIO 的文化特别契合,都想让数据成为未来的石油,都想让大大小小的企业用到普惠的数据智能。
在路上碰到新朋友,喝杯酒讲个故事,然后互道珍重各自上路,这一点儿都不稀罕;稀罕的,是某天你碰到了一个特别的朋友,你思前想后,决定不再独自上路,而是和他并肩开启新的旅途。这两个大叔就是如此,他们越聊越嗨,直接把“合作”聊成了“合并”。。。2022年4月,一个重磅的新闻猝不及防地传出,奇点云以收购 GrowingIO 的方式与后者合并。一个数仓的领头羊,一个数据分析应用的领头羊,加在一起就是羊羊羊。投资界直接给合并之后的奇点云超过10亿美元的估值。但投资人士怎么都想不明白:即便是收购,也得选 GrowingIO 遇到更大困难的时候,因为那样更便宜嘛。奇点云这么做,怎么看都有点“急”。如果从商业并购的角度,总会有机会花更少的钱完成并购。但少花一点钱根本不是目标,把事情做成才是我和 Simon 的目标。既然定了要兵合一处,那早一天合并,就能早一天心无旁骛地一起出发。这样反而是更好的结果。
在我见到 Simon 时,他已经有了新的身份——“分析云”的负责人。奇点云和 GrowingIO 之前的数据应用此时已经全部都归到了“分析云”麾下。至此,奇点云不仅敢拍胸脯说:俺有最好的“王冠”。也敢拍着胸脯说:俺还有最好的“珍珠”。我手里恰好有行在和 Simon 2015年前后的照片。和今天一对比,六七年过去,岁月还是在这两位大叔脸上留下了些许痕迹。不过,岁月大概也是善良的,他给人皱纹的时候,也在人心中种下了对远方的坚定,对同行者的珍惜。行在特别同意 Simon 说过的那句话:创业就是从一个坑里爬出来,然后掉进另一个坑。两位大叔作为资深“爬坑达人”,当然知道前路肯定还有万道荆棘,但有了旅伴相互搀扶,“数据普惠”的路至少不再那么孤单了。2019年,爱徒步的行在带着奇点云的骨干同事们走了一次戈壁沙漠。旅途当然很苦。不仅要在干渴的沙漠中不停歇走上几天,还会经常在骄阳下迷路,只能靠一个指南针猜测方向。但行在却很享受这种心无旁骛的行进。可能创业也是这样,你不可能有地图,最多只有一个指南针。你不能指望所有的路都走对,但只要朝着正确的方向,你总能到那里。
2020年,奇点云的美国同行 Snowflake 在纳斯达克上市,在巴菲特重金加持下,一度冲上千亿美金的市值。于是,普通人根本搞不懂的“数仓技术”突然被舆论热捧。而大洋彼岸,作为中国数仓的领跑员,奇点云也渐渐走到聚光灯的中心。说到奇点云被热捧,地雷突然想起什么,给我讲了一个故事。上大二的时候,地雷在网上偶然看到一个开源游戏,就下载来玩。玩的过程中他发现了一个隐藏很深的 Bug,于是顺着联系方式找到了作者,把问题告诉了对方。网线对面的那位老哥很是欣喜,因为遇到了志同道合的朋友。地雷想了想,自己喜欢搞软件系统,做游戏实在提不起兴趣,于是婉拒好意。十年后,在《计算机报》上,地雷偶然看到了一个采访,主角正是多年前有过“Bug 之缘”的这位游戏开发者。在文中他讲了自己的故事:很长时间,其实他连饭都吃不饱,可他就是喜欢做游戏,不管怎样都要去做。而那篇报道的结尾是,他的公司刚刚被盛大收购,作价几亿人民币。作为一个网友,我真心为他高兴。因为他是有技术梦想的人,我能感同身受。我们自己在数仓领域坚持了十几年,无论多难也没想过离开,因为这就是我们的热爱。现在数仓热了,难道我们不该成功,不该赚大钱吗?
有人把这些执拗的人获得回报的那一瞬间称为“英雄时刻”。从历史中,你可以看到一个国家的命运逻辑。就拿德国来说,他们的制造业天下无敌,所以在软件领域才能出现 SAP 这样的顶尖公司。所以,中国之所以有我们这群人,是因为我们国家拥有世界最强大的数字商业系统,每个中国人每天都在为数据这种能源贡献力量。
我眼前出现一幅图画,大大小小的乡村城市,熙熙攘攘的人群,你我的一颦一笑,生活琐碎,不仅是我们热烈活过的证据,它更将汇入能源之河,作为石油流淌在轰鸣的时代中。至此,当你捧起数据仔细辨认,它便不只是像石油一样黑乎乎的能源,它也是每个人曾经有过的浪漫故事。
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing