如何做用户画像分析?
共 3706字,需浏览 8分钟
·
2022-07-22 11:02
我们经常在淘宝网购物,作为淘宝方,他们想知道用户是什么样的,年龄、性别、城市、收入、购物品牌偏好、购物类型、平时的活跃程度等,这样的一个用户描述就是用户画像分析。
在实际工作中,用户画像分析是一个重要的数据分析手段,帮助产品策划人员对产品功能进行迭代,帮助产品运营人员做用户增长。
作为产品策划人员,需要策划一个好的功能,获得用户最大的可见价值与隐形价值、必须价值与增值价值,那么了解用户并做用户画像分析,是数据分析师帮助产品策划做更好的产品设计重要的一个环节。
作为产品运营人员,比如针对用户的拉新、挽留、付费、裂变等的运营,用户画像分析可以帮助产品运营人员去找到他们的潜在用户,从而用各种运营手段去触达。因为,当我们知道群体特征时,也基本可以判定潜在用户也是类似的一群人,这样才可以精准地寻找新用户,提高ROI。
总的来说,用户画像分析就是基于大量的数据,建立用户的属性标签体系,同时利用这种属性标签体系去描述用户。
用户画像分析的作用
用户画像分析的作用主要有以下几个方面(见图1)。
图1
(1)广告投放
在做用户增长时,我们需要在一些外部渠道投放广告,吸引可能的潜在用户,比如,B站在抖音上投放广告。
我们在选择平台进行投放时,有了用户画像分析,就可以精准地进行广告投放,比如,抖音中主要的用户年龄为是18~24岁,那么广告投放时就可以针对这部分用户群体,提高投放的ROI(见图2)。假如我们没有进行用户画像分析,那么可能会出现投了很多次广告,结果没有人点击的情况。
图2
(2)精准营销
假如某个电商平台需要做一个活动,给不同层次的用户发放不同的券,就需要利用用户画像分析对用户进行划分,比如,划分成不同付费次数的用户,然后根据不同付费次数发放不同的优惠券。给付费次数在1~10次的用户发放10元优惠券,依此类推(见图3)。
图3
(3)个性化推荐
个性化推荐即精确的内容分发,比如,我们在音乐类APP中会看到每日推荐,这是因为运营人员在做点击率预估模型(预测给你推荐的歌曲会不会被点击)时,会考虑用户画像属性,这样才有可能推荐用户喜欢的类型。比如,根据你是“90后”,喜欢伤感的音乐,喜欢周杰伦这些属性,推荐类似的歌曲给你,这就是基于用户画像推荐。
(4)风控检测
风控检测主要是金融或者银行业涉及得比较多,常见的问题是银行怎么决定是否放贷给申请人。普遍的解决方法是搭建一个风控预测模型,预测申请人是否有可能不还贷款。模型的背后就有用户画像分析的功劳。用户的收入水平、教育水平、职业、是否有家庭、是否有房子,以及过去的诚信记录,这些画像数据都关系到模型预测是否准确(见图4)。
图4
(5)产品设计
互联网的产品价值离不开用户、需求、场景这三大元素,所以在做产品设计时,要知道用户到底是怎样的一群人,他们的具体情况是什么,他们有什么特别需求,这样才可以设计出对应解决他们需求和痛点的产品功能。
在产品功能迭代时,我们需要分析用户画像行为数据,发现用户的流失情况。典型的场景是用漏斗模型分析转化情况,就是基于用户的行为数据发现流失严重的页面,从而优化对应的页面。
比如,我们发现从下载到点击付款的转化率特别低,这可能是付款按钮做得有问题,可以有针对性地优化按钮的位置等。
同时,还可以分析这部分转化率主要是在哪部分用户群体中低,假如发现高龄用户的转化率要比中青年的转化率低很多,则有可能是因为字体的设置及按钮位置不显眼等,或者操作不方便。
(6)数据分析
在进行描述性数据分析时,经常需要用户画像的数据,比如,描述抖音中某美食类博主的用户群体特征,可以关注他们观看其他抖音视频的情况,关注其他博主的情况等(见图5)。
图5
简单来说,用户画像分析可以帮助数据分析师更加清晰地刻画用户。
如何搭建用户画像
用户画像架构如图6所示。
图6
(1)数据层
进行用户画像分析的基础是获取完整的数据,互联网数据主要是利用打点,也就是通常所说的数据埋点上报的。整个过程是数据分析师根据业务需要提交数据上报的需求,然后由开发人员埋点,获得数据(见图7)。
图7
除了上报的数据,还有从数据库中同步的数据,一般会存到Hive表中,按照数据仓库的规范,根据主题来放置。其他数据,比如调研的数据,以Excel格式存在,就需要把Excel 数据导入Hive 表中。
(2)挖掘层
有了基础数据以后,就进入挖掘层,挖掘层主要做两件事情,一个是数据仓库的构建,另一个是标签的预测,前者是后者的基础。
一般来说,我们会根据数据层的数据表,对这些数据表的数据进行清洗、汇总,然后按照数据仓库的分层思想,比如按照数据原始层、数据清洗层、数据汇总层、数据应用层等进行表的设计(见图8)。
图8
数据原始层中的数据就是上报的数据,没有经过数据清洗处理,是最外层的用户明细数据。
数据清洗层主要是数据原始层的数据经过简单清洗之后的数据,已去除“脏”数据等明显异常的数据。
数据汇总层的数据主要是根据数据分析的需求,针对想要的业务指标(比如,用户一天的听歌时长、歌曲数、歌手数等),按照用户的维度,把用户行为进行聚合,得到用户的轻量指标的聚合表。
数据汇总层的作用主要是可以快速汇总数据,比如,一天的听歌总数、听歌总时长、听歌时长高于1小时的用户数、收藏歌曲数多于100的用户数等的计算。
数据应用层主要面向业务方的需求进行加工,可能是在数据汇总的基础上加工成对应报表的指标需求,比如,每天听歌的人数、次数、时长;搜索的人数、次数、歌曲数等。
按照规范的数据仓库把表格设计完成后,就可以得到一部分用户的年龄、性别、地域的基础属性数据,以及用户浏览、付费、活跃等行为数据。
有些用户的数据无法获取,以QQ音乐为例,我们一般无法获取用户的听歌偏好属性的数据,需要通过机器学习模型对用户的偏好进行预测(见图9)。机器学习的模型预测都是基于数据仓库的数据,完整的数据仓库数据是模型特征构建的基础。
图9
(3)服务层
有了数据层和挖掘层以后,用户画像体系基本形成,那么就到了用户画像赋能的阶段。最基础的应用就是利用用户画像宽表的数据,对用户行为进行洞察归因,挖掘行为和属性特征的规律。
另外,比较大型的应用就是搭建用户画像平台,其本质是用户画像表的集成。
用户提取:我们可以利用用户画像平台,快速提取用户数据,比如,提取18~24岁的女性群体,且听过周杰伦歌曲的用户。
分群对比:可以利用用户画像平台进行分群对比。比如,比较音乐类APP中VIP用户和非VIP用户在行为活跃和年龄、性别、地域、注册时间、听歌偏好上的差异。
功能画像分析:可以利用用户画像平台快速进行某个功能的用户画像描述分析,比如,音乐类APP中的每日推荐功能,我们想要知道使用每日推荐的用户是哪些用户群体,以及使用每日推荐不同时长的用户特征分别是怎样的。
本文节选自《数据分析方法论和业务实战(全彩)》,欢迎阅读此书了解更多相关内容。
数据分析的精髓在于能够利用合理的数据分析方法来解决实际的业务问题,本书介绍了数据分析常见的思维和方法,并且呈现了这些分析方法在实际案例中的应用。
同时也利用本书解答了大家对于想要从事数据分析行业的一些担忧和困惑。
阅读本书,你会对数据分析的工作内容有更清晰、完整的了解,同时对常见的业务问题处理的方法和经验有质的提升。
陈友洋,毕业于香港中文大学和中山大学,腾讯前数据科学家,数据分析类公众号“渔好学”主理人,分享多篇数据相关的干货文章。在知乎(知乎账号:渔好学)上分享的数据分析相关文章的全网阅读量超2 000 000次,广受好评。在数据分析、数据体系搭建、数据科学方面具有多年经验,积累了丰富的数据分析项目经验。
本书涵盖了数据分析的系统知识和业务实践,不仅涵盖了数据分析的基本工具、思维和方法论,还包括具体的业务问题应用,是市面上难得的理论与实际相结合的作品。本书内容囊括了作者多年工作沉淀的丰富经验,体现了作者在数据分析方面的深厚造诣,无论是对于入门者,还是互联网从业者,都是一本难得的“武功”秘籍。
——赵猛,腾讯算法工程师
作者从实操角度切入,将数据分析经典方法论与业务工作融会贯通,真实案例为引,以创新模式拓宽数据分析应用的阳光大道,引人入胜、百看不厌。
——刘王翔,中国移动资深项目经理
数据分析是一门艺术,既需要业务知识,也需要数据分析方法。本书从数据分析在行业内的应用出发,全面地介绍了漏斗分析、相关分析、RFM用户分群、5W2H等多种常用的数据分析方法,从方法到实践,由表及里,由浅入深,是一本不可多得的好书。
——李渝方,“数据万花筒”公众号主编 《数据分析之道——用数据思维指导业务实战》作者,阿里巴巴前数据分析师
扫码了解本书详情!
如果喜欢本文 欢迎 在看丨留言丨分享至朋友圈 三连 精选留言获赞最多的两位 将获得本号免费赠书 热文推荐