快手因果推断与实验设计
数据派THU
共 5286字,需浏览 11分钟
·
2021-09-01 20:05
来源:DataFunTalk 本文约4500字,建议阅读8分钟 本文主要以快手直播的现实任务为例进行展开,介绍快手因果推断与实验设计的相关工作。
基于观测数据的因果推断,即从已有实验和非实验数据中提炼因果关系; 在产品设计上构建正确的AB实验,合理计算指标,度量产品功能和迭代的影响; 通过经济模型、机器学习算法和数据、实验的结合构造反事实推理来回答长期效应问题。
① 双重机器学习模型
② 因果随机森林模型
把数据分成训练集和估计集,一部分训练集去构造树,另一部分估计集去估计因果效应和方差; 在树的分区方式上,使用各个节点的方差对目标函数加以修正。
③ Meta-Learner for Uplift Modeling
Constraint-based Algorithms Score-based Algorithms
时间片的选择 实验总周期选择 随机切换时间点是什么样子的
Outcome有一个绝对上界 用户无法知晓下一个时间是否是实验组 如果时间片之间存在干扰,干扰的影响是固定且有限的
编辑:王菁
校对:林亦霖
评论