从面试中梳理数据中台产品经理技能图
共 4748字,需浏览 10分钟
·
2021-03-15 07:57
数据中台是近几年火热到发烫的概念,中国TOP大厂以及很多小厂都在建设数据中台,就导致数据中台产品经理是一个薪资高、人才缺口十分大的岗位。
但是要想拿顺利拿到数据中台产品经理的offer还是不太容易,数据中台对产品经理的能力要求还是比较高:
一方面,作为数据中台的产品经理,你要对中台、业务中台、数据中台这些比较新的概念都要有比较深刻的理解。你还要对数据敏感,能够通过数据分析洞察更加深层次的问题,通过数据解决别人无法解决的问题,从而提高产品的价值。
另外一方面,阿里巴巴早在2015年就公布了中台的概念,说明其早已把中台体系做得很成熟,如果你并非阿里员工,没有亲身经历中台的搭建,就很难理解中台究竟是干什么。网上大多数有关数据中台的资料都只是在讲一些浅显的概念。
问题一:你是怎么理解中台的?
中台就是是中心化的能力复用平台。“中”就是中心化,中台应该承担起企业所有的业务,也是企业的数据中台。
中台的第二个特点是能力复用,能够快速支撑起N条产品线的的搭建。中台是平台型产品,为应用提供通用的能力。一般来说 中台包括业务中台和数据中台。
问题二:你是怎么理解业务中台的?
比如阿里巴巴旗下有很多电商产品,有的产品面向B端,有的产品面向C端,这些产品基本都会用到账号系统、交易系统、营销系统等,而这些大的模块基本都是通用的,如果每个团队都重新开发一套账号系统、交易系统、营销系统等,就是对资源的严重浪费。
因此,由专门的团队负责开发这些通用系统,再将之赋能给各条产品线,这样做,既可以最大化重复利用资源,又可以将每条产品线的数据沉淀在一起。
问题三:你是怎么理解数据中台的?
几乎每条产品线都需要相关的数据分析工作,这些工作又会涉及数据分析师、数据开发工程师等角色。如果为每条产品线都配备数据分析师、开发人员,不但数据的标准得不到统一,而且也是对人力资源的一种浪费。数据中台可以承担公司所有产品线的数据分析工作,通过数据化的手段为各个产品线赋能。
为什么要搭建数据中台呢?阿里的军师曾鸣提出过一个概念叫“数据智能”,我们看一下什么是数据智能。以我们生活中常见的美团外卖为例,美团是如何调动千万量级的商户和遍布全国的外卖骑手将外卖安全、快速地送到用户的手上呢?如果靠人力进行调度,以美团如此大的业务量,其需要花费的人力是难以想象的。因此美团一定拥有一套不断迭代的智能调度算法,这套算法可以帮助用户找到合适的餐馆,帮助餐馆找到合适的骑手,从而以最高的效率将外卖送到用户手上,所以美团是一个数据智能的公司。
数据智能的标志就是由机器代替人工去决策,未来数据智能是一个企业的核心竞争力之一。那么怎么实现企业的数据智能?答案就是建设数据中台。建设数据中台的最终目标就是帮助企业实现数据智能。
问题四:你认为业务中台和数据中台有什么关系?
业务中台的目的是一切业务数据化;数据中台的目的是一切数据业务化。业务中台和数据中台是相辅相成的。
如果公司有业务中台,并且由一个专门的团队负责,那么数据中台的建设会容易很多,因为业务中台已经整合了公司内所有产品线的业务模块,使通用的业务数据都被统一存储到业务中台,这样就不用再对每个产品线单独进行调研,沟通成本会大大降低。
如果公司没有业务中台,也可以建设数据中台,只不过要多做一些工作,要从各条业务线分别采集数据,所以公司建设业务中台,会让数据中台的建设工作事半功倍。
问题五:你觉得什么公司适合建设中台?
短期来看,中台的建设成本比较高。业务中台要具备支撑公司所有产品线的核心业务能力,数据中台要支撑公司所有产品线的数据分析相关工作,因此开发相关系统,前期的投入比较大。
不过公司在搭建好中台并具备核心的业务能力和数据能力之后,再去扩展产品线时,新增的产品线的建设所需的成本就没那么高了,新产品线只需接入中台即可,所以从长远来看,中台还是能够降低企业研发成本的。
判断一家公司到底是否适合建设中台,可以看看该公司的产品线数量。如果公司有多条产品线(至少三个产品线以上),各个产品线之间有很多可以复用的功能,那么该公司就适合搭建中台。
初创公司是不适合搭建中台的,因为搭建中台需要投入大量的人力物力成本,大多数初创公司前期基本只有一条核心产品线,因此等到公司发展出多元的业务再搭建中台也不迟。
问题六:如果你是数据中台的产品经理 你会做哪些内容?
数据中台主要承担以下四个方面的工作,分别是对数据的“采集”“存储”“打通”“使用”。
“采集”是指采集各条业务线的数据(如业务数据、日志数据、用户行为等),并将这些数据集中处理,存放在数据中心。
“存储”是用更加科学的方式存储数据。业内一般采用三层建模的方式,让采集上来的数据变成公司的数据资产。
“打通”分为两方面。一方面要打通用户的行为数据和用户的业务数据,从而实现更加丰富的用户画像;另一方面是要打通产品线之间的数据,比如一个用户既用了A产品线的服务,又用了B产品线的服务,需要打通产品线才能挖掘出这些数据信息。
“使用”是用打通后的数据赋能业务人员、帮助领导层进行决策,用数据来反哺业务。
问题七:完成一个指标的开发都需要哪些人参与?
一个数据中台的项目需要10种不同角色(包括数据中台负责人在内)共同参与,包括架构师、项目经理、模型设计师、数据开发工程师、后端开发工程师、前端开发工程师、UI设计师、测试工程师。
问题八:请你简单介绍数据中台的工作流程?
如下图,数据中台完成一个指标的开发需要经历11个步骤,分别是业务口径梳理、技术口径梳理、数模型设计、数据开发、后端开发、前端开发、联调、测试、上线、迭代。
问题九:数据中台产品经理需要具备哪些能力?
1.学习能力
数据中台的目标是帮助公司内部N多产品线实现数据化运营、数据智能,那么就需要对各个业务线的用户、商业模式、业务流程有一定的了解,只有足够了解才能做出有价值的东西,这就需要数据中台的 产品经理花费大量的时间快速学习各个业务线的知识。
2.合作能力
数据中台的产品经理要对接的人很多有自己内部的开发、测试、设计人员,还要对接产品线的产品经理和运营,所以怎么更好的与这多种角色合作实现自己的目标就显得尤为重要。
3.创新能力
怎么通过数据使内部的运营工作更加高效,怎么通过数据更好的服务我们的用户和商家,这就需要数据中台的产品经理有很多创新的想法,并把它落地执行。
4.数据分析能力
数据中台的产品经理要对数据有很高的敏感性,通过数据分析发现一些深层次的原因,通过数据不断迭代我们的产品。
问题十:什么是用户行为数据,怎么采集用户行为数据?
用户无论在哪个客户端(iOS端、安卓端、小程序端、H5端)操作,用户产生的行为数据都分为两种:一种是浏览,一种是点击。这些隐性的行为数据,一般不会存储在业务线的数据库中,而是通过异步传输的方式传输并存储到数据采集服务器中。
为什么要花那么多的资源采集这些行为数据呢?因为这些数据对后期数据的挖掘应用是十分有用的。
举个例子,对于电商产品,如果没有行为数据的采集,我们是无法判断用户对某个商品的感兴趣程度,但是如果有了这些数据,我们就可以定义用户对商品的感兴趣程度,比如用户对某商品的1次点击,代表用户对该商品的兴趣度增加10分,而用户的3次点击代表他对这件商品非常有兴趣。
用户行为数据的采集有如下三种方式:
(1)与第三方移动应用统计公司合作完成数据采集。
(2)采用前后端埋点结合的方式完成数据采集。
(3)采用可视化埋点与后端埋点结合的方式完成数据采集。
问题十一:你是怎么管理公司的数据指标?
如何让指标定义清晰且没有歧义呢?解决这个问题的核心方法就是拆解——将一个数据指标拆解到不能再继续拆解为止,这样就能够最大化地保证大家的理解无误。假设我们要计算电商产品最近3个月的iOS客户端的下单金额。
首先这个指标属于电商产品业务板块,那么它的业务板块就可以定义为某电商业务线,下单金额在电商产品中属于交易模块这个指标的数据域就属于交易数据域。
下单金额是从订单中获得的,要基于订单的金额和下单的时间去统计下单金额,那么这个指标的维度就是订单。
原子指标是不可继续拆解的下单金额,由于加上了时间周期和修饰词(iOS客户端),那么这个指标就成为一个派生指标。
这样我们就把一个比较复杂的指标进行拆解和归类
问题十二:怎么识别虚荣指标?
比如常见的PV、UV、月活(即月活跃用户数)、总用户数、总商品数等指标都是虚荣指标,因为这些指标无法直接促进交易额增长,只起到对产品线监控的作用。
虚荣指标只能作为我们定的目标,并不能帮助我们增长,如果用户不下单,再多的UV、月活也没什么用。
问题十三:数据库和数据仓库有什么区别?
数据库与数据仓库的用途是完全不同的。数据库和数据仓库虽然都是用来存储数据的,但数据库是用来存储业务数据的,而数据仓库是用来存储汇总后的报表数据的,以支撑公司的决策分析。
问题十三:简单介绍一下数据仓库的分层机制?
业界比较通用的分层方式是将数据模型分为5层:①ODS(Operate Data Store,操作数据层)、②DIM(Dictionary Data Layer ,维度数据层)、③DWD(Data Warehouse Detail ,明细数据层)、④DWS(Data Warehouse Service,汇总数据层)、⑤ADS(Application Data Store,数据应用层)。
问题十四:有无负责过标签平台?标签平台是怎么做的?
(1)数据宽表功能。用来存储用户、商品等所有的指标。
(2)标签体系功能。将各条产品线共用的标签和非共用的标签,按照统一的层级结构组织起来。
(3)标签工厂功能。可以基于规则选择指标生成标签。
(4)人群圈选功能。通过组合不同标签组合形成人群。该功能一般与推送、营销系统对接。
问题十五:怎么评估一个拉新渠道值不值得做?
某个渠道是否值得投入是可以计算出来的。当我们在进行大范围推广前要进行小规模的灰度测试来证明渠道的可持续性。
比如地推人员拉来了一批新用户,就要看下接下来这批用户在平台上实际产生了多少交易额,如果周期内带来的交易额与周期内地推成本之比是大于1的,那么这个渠道就是可持续的。
如果两者之比小于1,一方面可以判断地推人员带来的用户质量是不合格的,另外一方面可以采取一些手段,看看能否促进地推人员的拉新质量。
如果采取了很多的手段,收入都无法覆盖成本,那就应该果断放弃这条拉新渠道,寻找其他更合适的拉新渠道。
问题十六:你是怎么理解留存率的?
留存率分为访问留存率和购买留存率。访问留存率是指新注册用户次日、7日、14日、30日后再次访问我们的产品的数量百分比;购买留存率是指首次购买用户在接下来的7日、14日、30日再次购买我们的商品的数量百分比。
问题十七:怎么理解访问时长、和跳出率?
访问时长:访问页面时长,即用户离开页面时间与用户进入页面时间的差值
跳出率:访问页面一定时间内跳出的用户数与页面UV的比值