归因分析:淘宝直播数据分析
导读:近年来,直播带货成为一种新的流行业态。主播在直播间与线上消费者实时互动,这极大的提高了信息交流的效率。在这种实时性极强的场景,主播对直播间实时信息的使用有可显著影响直播间的带货情况。
在线直播过程中能够实时的调整直播策略,提升直播质量,提升C端用户体验。
下播后,能够及时的复盘本场整体表现,直播能力、带货能力、互动能力、粉丝粘性、流量运营等是否满足预期,下次开播需要做哪些策略调整与准备。
希望有数据可以帮助了解自己的粉丝群体,以便于更好的做粉丝运营。
希望有数据可以辅助主播更好的成长,比如自己在行业中排名如何,竞对有哪些优点可以学习,自己哪些短板需要改进等(知己知彼百战不殆)
提供实时直播场次报告,通过不同维度、不同展现形式让主播能够在直播过程中实时查看全面的核心场次数据,并且同时支持PC和APP端查看。
提供下播报告,提供整个场次完整的数据内容,相比实时场次报告更是多了智能决策能力、流量运营汇总等能力
提供数据机器人,以对话的方式,方便主播及时查看直播诊断、行业排名等数据,给出成长建议,帮助主播成长
提供文本挖掘的能力,对于直播中评论文本进行挖掘聚类,为主播提供及时的C端用户心声(体现在场次报告中)
决策智能能力,识别直播过程中的关键时间点,基于此做多模态归因分析,将多模态识别结果及直播快照在离线场次报告的趋势图模块进行展示。
针对头部主播,提供主播大屏,方便运营团队人员实时查看直播核心数据,特别是在促销和大促时,便于团队多人协作、及时作出合理决策。
提供场次对比能力,允许主播快速多维对比历史多场表现,总结直播经验,提升复盘效率。
访问主要包括观看次数、浏览次数、在线人数、观看时长等指标
转化主要包括新增粉丝数、商品引导PV\UV、点击率等指标
成交主要包括引导成交笔数、人数、金额,预售下定金额、尾款金额等指标
目前我们做的是每5分钟打一个点,数据实时更新,让主播可以直观的看到直播过程中数据的趋势变化,以辅助其做出合理的决策;
该模块中集成了多模态识别归因能力,根据相关指标趋势的波峰波谷时间点通过算法模型计算出异常点位,然后配合直播快照、商品上下架、互动数据及多模态能力识别出在某个异常点是因为什么原因导致的该指标异常,同时将直播回放定位到该时间点点位,大大提升主播发现复盘改进提升的效率。
实时流量运营主要是进入到直播间的流量来源趋势图,目前包含关注、推荐、广告、店铺、搜索等13种流量来源,主播可以根据每种流量来源的趋势数据进行实时流量运营及决策
分渠道流量运营主播可以判断场次整体的流量分布是否符合预期,有问题可以快速发现
我们重点针对Lindorm和ADB进行了调研、验证和对比,由于产品特性(多维查询、实时性、灵活性要求比较高)最终选择了ADB进行支持。
由于数据助理是直接服务与淘宝主播,所以对于稳定性要求非常高,为了保障产品的高可用,我们做了核心链路【计算、存储、服务】的双链路保障。
通过霸下进行拦截恶意攻击流量,降低数据2/3的恶意无效数据访问,大大降低了存储及服务的资源消耗。
在其他直播业务有复用需求后,我们也及时的升级了数据链路,提取实时数据中间层,DWS数据同时写入ADB、Lindorm、TT以支持不同直播业务场景的需求,做到了一份数据、一个口径、多场景复用。
数据接入层:主要来源于直播业务数据、集团公共层、达摩院智能数据
数据中间层:分为DWD、DWS层、维表、又包含实时数据建设和离线数据建设,以下重点将实时部分、离线数据建设和实时是保持一致的
DWD层重点建设直播间明细层数据,其中包含直播间曝光、点击、观看、互动(评论、点赞、分享、关注等)、商品引导、商品成交、商品预售、直播间文本语义识别、多模归因、关键点识别等数据
DWS层我们主要做了直播间、直播间+商品、直播间+渠道、直播间+来源、直播间+粉丝等直播间相关维度的汇总及趋势数据、同时还包含直播间的多模数据
维表:包含了直播业务链路中的各种维度数据,比如直播间、主播、商品、用户、商家、商品类目、渠道、来源等等
业务应用:这里主要是中间层数据服务的对象,包括达摩院直播赛道【数据助理、数字人、直播一体机、主播助理】、直播中控台、生意参谋、产品360等等
相比于对照组,实验组预售商品的主要点击时间区间没有显著延长,故不支持假设1;
相比于对照组,实验组预售商品的销售效率显著提高,故支持假设2。
相比于对照组,实验组中用户对预售的讨论比例更高;
相比于对照组,实验组中用户提到缺货信息比例更低;
相比于对照组,实验组中用户问题比例更低。
清华大学经管学院电子商务实验室:王伶俐 博士生、陈国青 教授、郭迅华 教授
休斯顿大学:何玉梅 博士后、Yili (Kevin) Hong 教授、Nina Huang 副教授
推荐阅读
欢迎长按扫码关注「数据管道」