均值与期望到底是不是一回事?

俊红的数据分析之路

共 1509字,需浏览 4分钟

 ·

2021-04-18 12:46

均值和期望是我们平常接触比较多的两个概念,均值大家都知道,就是若干个值先求和,然后再除值的个数;那期望又是什么。一般人们为了便于理解,就会说,你把期望也理解成是均值就可以了。那到底可不可以这样呢,我们这一篇来具体看看。

先来看看期望这个概念的历史:

早在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目,题目是这样的:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100法郎的奖励。比赛进行到第三局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平?用概率论的知识,不难得知,甲获胜的概率为1/2+(1/2)(1/2)=3/4,或者分析乙获胜的概率为(1/2)(1/2)=1/4。因此由此引出了甲的期望所得值为100*3/4=75法郎,乙的期望所得值为25法郎。这个故事里出现了“期望”这个词,数学期望由此而来。

通过上面的故事我们可以看出,期望是一种通过概率计算出来的值,是理想状态下我们希望得到的结果。不常有一句话叫做,期望越大失望越大么,这里面的期望其实就和我们这里提到的期望差不多。

我们再来看一下期望的数学定义是怎么定义的,期望一般用E(X)来表示。

E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn)

X1,X2,X3,……,Xn表示具体的n个值,p(X1),p(X2),p(X3),……,p(Xn)为这几个值对应的出现的概率。在已知的一份数据集中,概率值p(X1),p(X2),p(X3),……,p(Xn)可以理解为值X1,X2,X3,……,Xn出现的频率f(Xi),则:

E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn) 
     = X1*f1(X1) + X2*f2(X2) + …… + Xn*fn(Xn)

某个值出现的频率=该值出现的次数/所有值出现的次数之和。

现在有下面这么几个值,我们来分别计算一下这些值的均值和期望。

1,1,2,5,2,6,5,8,9,4,8,1

均值 = (1+1+2+5+2+6+5+8+9+4+8+1)/12 = 13/3

每个值出现的频率为:

频率
1f(1)=3/12
2f(2)=2/12
4f(4)=1/12
5f(5)=2/12
6f(6)=1/12
8f(8)=2/12
9f(9)=1/12
期望 = 1*f(1)+2*f(2)+4*f(4)+5*f(5)+6*f(6)+8*f(8)+9*f(9) = 13/3

我们可以看到计算出来的两个值是相等的,这是巧合吗?不是的,在已知的一份数据集中,这两个值计算出来都是相等的。

均值和期望的本质上的区别是前者是是一个具体的、实际的值,而后者是通过概率得出来的值;两者在一般情况计算出来的值都是一样的,这也就是为什么会有把期望理解成均值的做法。

点分享
点收藏
点点赞
点在看
浏览 39
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报