抽样分布:经常听到的卡方分布、t分布等的含义是啥?
共 1570字,需浏览 4分钟
·
2021-03-26 14:54
“ 统计学相关知识,是数据科学重要的基础之一。”
01
—
抽样分布
首先,什么是抽样分布呢?
在上篇文章中,我们介绍了统计量的概念(不含任何未知参数的样本的函数,就叫统计量),统计量的分布,就是抽样分布。
抽样分布中,最常用的分布其实是4种:z 分布(即正态分布)、卡方分布、t分布、F分布。每种分布对应假设检验中的一种检验方法,后续讲假设检验的时候再详细讲解。因此这几种分布的知识是后续重要的基础。
关于正态分布大家都比较了解,因此重点阐述一下后面的三种分布。
02
—
卡方分布
先介绍一下卡方分布相关的内容。
(1)卡方分布的定义
定义:当 ,则以下的统计量(即样本取平方后求和):
服从自由度为n的分布,即卡方分布。记为:。这里的自由度,指的就是独立变量的个数,因此肯定是正整数。
(2)卡方分布的图像及特点
卡方分布的图像如下:
当自由度是2的时候,比较特殊,刚好是指数分布。
当自由度大于2的时候,卡方分布的曲线都是单峰曲线,在n-2处取得峰值。
曲线关于x=n-2是不对称的,当n越大,峰向右移动;当n无限大时,可以用正态分布近似。
(3)卡方分布的相关定理
卡方分布的期望和方差有以下特点:
卡方分布具有可加性。当两个(或者多个)随机变量均服从卡方分布时,且相互独立,那么加和之后的分布也服从卡方分布,自由度是两个自由度之和,即:
关于卡方分布,就主要介绍这些。
03
—
t分布
接下来我们介绍一下t分布。
(1)t分布的定义
定义:当 , Y服从自由度是n的卡方分布,且X、Y相互独立,则以下的统计量
服从自由度为n的t分布。因此,t分布是由标准正态分布和卡方分布构造的分布。
(2)图像及特征
t分布的图像如下:
t分布是具有对称性的。
04
—
F分布
最后我们介绍一下F分布。
(1)F分布的定义
定义:当,且U、V相互独立,则以下的统计量
服从自由度为 的F分布。这里的两个自由度是有先后顺序关系的。因此,如果互换一下分子分母,很容易得出结论:
从上面很容易了解到,F分布是由两个卡方分布构造的。
(2)F分布的图像
F分布的图像如下:
05
—
正态总体下的抽样分布
几个重要的分布讲完了,最后我们再介绍一下在总体是正态分布的前提下,常用统计量的分布规律。再强调一下,下面的规律都是基于总体服从正态分布的前提,这里只需要总体是正态分布即可,不需要是标准正态分布。
以下的这几个抽样分布还是很重要的,后续做区间估计的时候会用到这几个构造枢轴变量,用以进行总体参数估计。
(1)关于样本均值的分布
样本均值经过以下标准化后,服从标准正态分布。
即样本均值的期望等于总体期望,样本均值的方差是总体方差的n分之一。
若将分母中的总体标准差改为样本标准差,则服从自由度为n-1的t分布:
这两个不同处理之下的不同分布,还是需要注意一下。
(2)关于样本方差的分布
样本方差乘以系数后,服从自由度为n-1的卡方分布:
需要注意的是,这里的自由度是n-1,因为这里样本方差是用每个样本减去样本均值。如果改为减去总体均值,其他内容不变,则服从自由度为n的卡方分布。因为样本均值多了一个约束(均值公式),因此自由度少了一个。
(3)关于样本均值和样本方差的关系
样本均值和样本方差相互独立。
(4)两个正态总体时,两样本的关系
上面讲到的几个都是在单个正态总体的情况下。当有两个正态总体时,两个样本的方差和两个总体方差有以下分布:
即处理后的分布服从F分布。
另外,一种特殊情况下,当时,
其中,
关于卡方分布、t分布、F分布相关的内容就先分享到这里,欢迎继续关注~