快手因果推断与实验设计
数据管道
共 5250字,需浏览 11分钟
·
2021-08-20 17:21
导读:理解和识别用户行为指标的相互关系是实验分析的目标。在社区氛围下,影响用户行为的因素更为复杂,关系识别更为困难,如何使用各种学科的方法,对社区进行宏观或微观的建模分析,系统性的评估各种策略的长期生态影响,是所要解决的重要问题。
基于观测数据的因果推断,即从已有实验和非实验数据中提炼因果关系;
在产品设计上构建正确的AB实验,合理计算指标,度量产品功能和迭代的影响;
通过经济模型、机器学习算法和数据、实验的结合构造反事实推理来回答长期效应问题。
把数据分成训练集和估计集,一部分训练集去构造树,另一部分估计集去估计因果效应和方差;
在树的分区方式上,使用各个节点的方差对目标函数加以修正。
Constraint-based Algorithms
Score-based Algorithms
时间片的选择
实验总周期选择
随机切换时间点是什么样子的
Outcome有一个绝对上界
用户无法知晓下一个时间是否是实验组
如果时间片之间存在干扰,干扰的影响是固定且有限的
推荐阅读
欢迎长按扫码关注「数据管道」
评论