均值与期望到底是不是一回事?
均值和期望是我们平常接触比较多的两个概念,均值大家都知道,就是若干个值先求和,然后再除值的个数;那期望又是什么。一般人们为了便于理解,就会说,你把期望也理解成是均值就可以了。那到底可不可以这样呢,我们这一篇来具体看看。
先来看看期望这个概念的历史:
早在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目,题目是这样的:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100法郎的奖励。比赛进行到第三局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平?用概率论的知识,不难得知,甲获胜的概率为1/2+(1/2)(1/2)=3/4,或者分析乙获胜的概率为(1/2)(1/2)=1/4。因此由此引出了甲的期望所得值为100*3/4=75法郎,乙的期望所得值为25法郎。这个故事里出现了“期望”这个词,数学期望由此而来。
通过上面的故事我们可以看出,期望是一种通过概率计算出来的值,是理想状态下我们希望得到的结果。不常有一句话叫做,期望越大失望越大么,这里面的期望其实就和我们这里提到的期望差不多。
我们再来看一下期望的数学定义是怎么定义的,期望一般用E(X)来表示。
E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn)
X1,X2,X3,……,Xn表示具体的n个值,p(X1),p(X2),p(X3),……,p(Xn)为这几个值对应的出现的概率。在已知的一份数据集中,概率值p(X1),p(X2),p(X3),……,p(Xn)可以理解为值X1,X2,X3,……,Xn出现的频率f(Xi),则:
E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn)
= X1*f1(X1) + X2*f2(X2) + …… + Xn*fn(Xn)
某个值出现的频率=该值出现的次数/所有值出现的次数之和。
现在有下面这么几个值,我们来分别计算一下这些值的均值和期望。
1,1,2,5,2,6,5,8,9,4,8,1
均值 = (1+1+2+5+2+6+5+8+9+4+8+1)/12 = 13/3
每个值出现的频率为:
值 | 频率 |
---|---|
1 | f(1)=3/12 |
2 | f(2)=2/12 |
4 | f(4)=1/12 |
5 | f(5)=2/12 |
6 | f(6)=1/12 |
8 | f(8)=2/12 |
9 | f(9)=1/12 |
期望 = 1*f(1)+2*f(2)+4*f(4)+5*f(5)+6*f(6)+8*f(8)+9*f(9) = 13/3
我们可以看到计算出来的两个值是相等的,这是巧合吗?不是的,在已知的一份数据集中,这两个值计算出来都是相等的。
均值和期望的本质上的区别是前者是是一个具体的、实际的值,而后者是通过概率得出来的值;两者在一般情况计算出来的值都是一样的,这也就是为什么会有把期望理解成均值的做法。