从中国人口数据谈指标体系构建
共 3574字,需浏览 8分钟
·
2021-09-13 10:56
指标体系构建是数据分析师核心工作之一,对于刚入门或者想要转行的朋友来说,“指标体系”这个词对于你来说一定很陌生,今天我们会以中国人口数据为例,告诉大家什么是指标体系,指标体系有什么作用,什么样的指标体系才是好的指标体系。
什么是指标体系
指标体系是一个比较抽象的概念,百度百科上这样定义指标体系--“指标体系是指由若干个反映社会经济现象总体数量特征的相对独立又相互联系“。看完这句话,一头雾水,还是不知道什么是指标体系,接着看!
我们想象一个场景,假如我们在谈论中国人口现状这个话题,那么你会如何衡量中国现有人口现状呢?
你可能会说:“今年的人口总数达到14亿多了!","出生人口数感觉比往年少了很多",“人口老龄化也太严重了吧!”
那如果是正式场合呢,就需要数据指标登场了,这些口语化的话术基本就不能用,我们需要用精准的数字和具体的指标来说明中国人口现状!
官方的说法是这样的,据国家统计局发布的2019年经济年报数据显示,2019年全国人口总量超过14亿,新生人口数1465万人,人口出生率为10.48‰;死亡人口998万人,人口死亡率为7.14‰;人口自然增长率为3.34‰
来源:人口增长杂志,第六章,人口地理学,侵删
http://reader.epubee.com/books/mobile/5a/5a44f59298846b60aebb344670f62b0f/text00013.html
上面的例子中,”人口总数“,”出生率“,”死亡率“,”自然增长率“是四个不同的指标,它们从不同的维度衡量了中国人口现状;当我们把多个不同的指标有规律,有体系的组织在一起共同去量化人口现状时,它们就成了一套指标体系。
所以,根据上面的例子,我们可以重新给指标体系下一个定义,指标体系是指标与体系的结合体,是一套从多个维度拆解业务现状并有系统有规律的组合起来的多个指标。也就是说单个指标只能叫指标,多个有一定规律,内部有一定关联的指标的组合才能叫做指标体系。
为什么需要指标体系
看完上面的定义我们已经知道指标体系是什么了,那你可能会问,指标体系到底有什么用处?指标体系的功能大致可以分为三点,第一,指标体系是一套标准化的衡量指标,可以监控业务的发展情况;第二,指标体系可以形成表转化的体系模版,并且可以固化下来以减少重复的工作;第三,如果业务出现问题,我们可以通过指标拆解,迅速定位业务问题,给出业务优化方向。
(1)形成标准化的衡量指标,监控业务发展状况
指标体系是一套固化下来的业务监控指标,可以长期监控业务的发展变化趋势,评价业务的现状。
回到全国人口现状的例子,如果我们仅看近五年的人口变化趋势,我们会发现人口死亡率基本恒定在7%左右,出生率和自然增长率虽然略有降低,但是也分别恒定在11%和3.5%左右。从近五年数据来看,人口状况变化看似变化并不大,出生率大于死亡率,人口保持正增长,似乎还是一个比较理想的状态。
但是,我们将时间线拉长到40年,情况就不容乐观了。我们会发现在1978到2019近41年的时间里,死亡率是恒定的,但是出生率和自然增长率在1990年左右出现了剧降,分别从25%,15%降到3.5%左右。
有了出生率,死亡率以及自然增长率等指标体系并且长期监控,我们就很容易发现中国人口现有的一些问题了,这也是指标体系存在的第一个意义。
(2)通过指标分级治理,快速定位业务问题,优化业务方向
从上述的分析当中呢,我们很容易地发现了中国人口现有问题,自然增长率太低,如果这个问题不解决就意味着未来年轻人会越来越少,老年人会越来越多;那要解决这个问题,我们就需要具体的定位一下问题,从而才能对症下药。
首先,我们对自然增长率这个指标进行拆解,清晰地指出哪些指标影响到了自然增长率。我们知道自然增长率等于出生率减去死亡率,当死亡率基本恒定的情况下,出生率降低,自然增长率自然也会降低。因此,我们找出了自然增长率降低的主要原因是由于出生率降低,这也是各类专家在提出全面开放二孩的基础上又再次提出全面开放三孩的建议的原因。
但是这些出生率为什么会降低呢,还需要继续进行指标的拆解,去找出真正影响出生率的因素。比如,人口结构失调,男女比例失调,房价,医疗,教育等都会影响到生育意愿。
在这里,我们对出生率这个指标继续进行拆解,如何拆解呢?我们先抛出一个问题,如果要提高出生率,你会从那几个方面着手?
我们首先会考虑让已婚人群尽可能生1-2孩;其次,对于适龄未婚人群,制造条件机会让他们尽快成婚生小孩。有了这样的思路之后,我们就可以按照已婚和未婚两个群体进行拆分,进一步探究影响这两个群体生2孩或成婚的因素。对于已婚人群,可能存在着房贷压力,医疗负担,赡养负担,抚养负担等等;而对于适龄未婚人群则可能是因为男女比例失调找不到合适和男女朋友,还在念硕士博士学业压力大以及恐婚等等因素。最终的原因还需要结合数据和实际调查得出,我们这里不做过多的展开,只做指标拆解分析。
通过上述的指标拆解外加数据验证就可以逐步的找到自然增长率下降的原因,解决最根本的原因而非单纯的催婚催生催育才是提高自然增长率的最有效的途径和方法。
我们总结下上述的过程,首先,我们建立了自然增长率相关的指标体系;其次,我们通过拆解自然增长率这个指标前后的关联关系,通过回溯和下钻对自然增长率这个指标进行了三级拆解,最后我们通过相关数据验证以及实际调查得出最终影响自然增长率的因素。
(3)形成标准化体系,减少重复工作,提高分析效率
指标体系是数据结果体系化的展示,做好指标体系这一块工作可以让统计分析师少干一些临时取数的活,同时可以实现业务之间的横向和纵向对比(前提是具有可比性的业务)。
还是拿人口状况的例子来说,全国人口累计超过14亿,国家统计局不可能公开每一个人的数据,就算公开了我们也没有那么多的时间和精力去看每一个个体的具体情况,所以需要一套完整的指标体系去监控人口状况;而且如果每年的指标体系不一样的话,那么也进行纵向对比也没太多意义,所以一套固化下来的指标体系显得尤为重要。
指标体系的评价标准以及注意事项
回到现实的工作当中,什么样的指标体系才是好的指标体系呢?
一套好的指标体系,会极大的减轻统计分析师们的临时取数需求,因为业务存在的问题都可以通过指标体系中的数据回溯,下钻和分级拆解得到很好地暴露。如果你做完一套指标体系之后,业务还是频频找你提取数需求的话,那可能是你的指标体系还存在优化的空间,这时候就该先找下指标体系的问题了。
如果指标体系没有较大问题,那如何通过现有指标体系评价业务现状呢?
作为数据分析师,通常都会用到比较的方法,有比较才有说服力,一般情况下我们会用现有的业务指标和大盘数据(也就是我们说的benchmark)进行比较,从而说明业务现状。
那构建一套指标体系需要注意哪些问题呢?
(1)数据提前埋点
对于互联网公司而言,数据产生于用户行为,用户行为都是通过埋点促发而记录,所以要获得相应的用户数据就得先埋好点。
(2)统一指标口径
统一指标计算口径也是很重要的步骤,统一的计算口径可以使得业务具有横向和纵向的可比性,所以需要在统一整套指标体系的最小计算单位,不同的计算口径计算出的数据也会略有差异。
(3)指标穷尽且相互独立,遵循MCEC原则
对于某一块业务我们需要下钻和拆解,下钻维度和拆解维度需要相互穷尽且完全独立,也就是麦肯锡提出的MCEC原则,样才能更好的暴露业务存在问题。MCEC原则也会在指标体系构建方法中详细介绍。
参考文章
中国统计年鉴数据
http://www.stats.gov.cn/tjsj/ndsj/2019/indexch.htm
https://zhuanlan.zhihu.com/p/153286082
https://finance.sina.com.cn/china/gncj/2020-02-25/doc-iimxyqvz5539802.shtml
如果您觉得我们的文章还不错,请分享,点赞,再看,一键三连!!!