详解数据科学与数理统计的基本概念
大数据DT
共 4522字,需浏览 10分钟
·
2022-03-02 22:16
导读:数据分析要熟练掌握数据科学与数理统计的基本概念。
作者:张秋剑 张浩 周大川 常国珍
来源:大数据DT(ID:hzdashuju)
基础标签可以从原始数据直接获取,比如性别、年龄段、职业,可以供决策者使用,等价于信息和数据。 统计标签是通过原始数据汇总得到的,比如获得客户的价值标签需要将客户过去一段时间内在企业的所有消费进行汇总,并扣除消耗的成本。统计标签通过对原始数据进行简单的描述性统计分析获得。 模型标签比较复杂,是在基础标签、统计标签和已有的模型标签的基础上,通过构建数据挖掘模型得到的,比如客户的流失概率、违约概率的标签。
R(最后一次消费时间)标签可以代表客户的流失可能性,离最后一次消费时间越久的客户的流失可能性越高。 M(一段时期内消费的总金额或平均金额)标签可以代表客户的价值,消费额高的客户的价值高,因此可以初步确定重要保持和重要挽留客户都属于应该营销的客户。 最后一个标签F(一段时期内消费的频次)代表客户对打折券的兴趣。
数据库
统计学
人工智能/机器学习/模式识别
统计推断无用论
学习统计推断的产出/投入比低
划重点👇
干货直达👇
评论