常用的统计量和抽样分布

2023年2月18日 59次阅读来源: 柚子you

一、统计量

样本均值：即在总体中的样本数据的均值，反映样本数据的集中趋势。

样本方差：每个样本值与全体样本值平均数之差的平方值的平均数；方差是用来衡量随机变量和其数学期望（均值）之间的偏离程度。

样本变异系数：变异系数又称为离散系数，定义为标准差与平均值之比，样本变异系数即样本数据的标准差与其均值之比。

样本k阶中心矩：在概率论中，矩是用来描述随机变量的某些特征的数字，即求平均值；随机变量X的K阶中心矩定义：对于正整数k，如果E(X)存在，
E[(X-E(X))^K] <无穷大，
则 E[(X-E(X))^K] 为x的k阶中心矩。

样本偏度：常用作总体偏度的估计量和检验总体分布正态性的统计量，样本三阶中心距除以二阶中心距的3/2次幂的商记为SK；而总体偏度是一个描述总体分布不对称性的数字特征，正态分布的偏度为0。

样本峰度：常用以作为总体峰度的估计量，样本的四阶中心距除以样本二阶中心距平方的商再减去3，记为ku；正态分布的峰度为0。

二、抽样分布

中心极限定理：即不论总体服从什么分布，只要从总体中抽取的样本容量足够大，这些样本组成的样本均值的抽样分布都近似于正态分布。

样本方差的分布：作为随机变量的函数，样本方差本身就是一个随机变量，S^2服从卡方分布，
s 2 σ 2 ( n − 1 ) \frac{s^2}{\sigma ^2}(n-1) σ2s2(n−1)~ X ( 2 n − 1 ) X^2_(n-1) X(2n−1)

卡方分布：
卡方统计量是一个随机变量，能够表明样本方差和总体方差之间对的比值关系，卡方统计量决定的抽样分布就是卡方分布；
卡方统计量： χ 2 = ( n − 1 ) s 2 σ 2 \chi^2=\frac{(n-1)s ^2}{\sigma ^2} χ2=σ2(n−1)s2

定义：若样本量为n的所有可能样本均取自方差为 σ 2 \sigma^2 σ2的正态分布总体，计算每一个样本的卡方值（ χ 2 \chi^2 χ2），那么这些卡方值将构成关于样本方差和总体方差的卡方分布。卡方分布是一个连续型该流程分布。

作用：卡方分布能够用于从样本方差到总体方差的推断性分析；还能用于非参数检验（卡方检验）。

T分布：
若已知待分析的总体服从正态分布，从总体中抽取容量为n 的所有可能样本，计算出每个样本的T统计量，则所有的T统计量的值将组成一个连续型概率分布，此分布为T分布。T分布能在部分已知条件下，用于总体均值的推断分析。
对于T分布来说，如果总体服从正态分布，总体标准差未知，当样本容量小于30时，那么样本均值的抽样分布服从T~t(n-1)的T分布；
若总体服从正态分布，总体标准差未知，样本容量大于等于30时，那么样本均值的抽样分布不仅服从T~t(n-1)的T分布，而且还可以用Z分布来近似表达。

F分布：
F分布能通过两个样本之间的关系推导出两个总体之间的关系，能用于推断两个总体方差之间的比值关系。

F统计量：两个正态分布总体，总体方差为 σ 1 2 \sigma^2_1 σ12， σ 2 2 \sigma^2_2 σ22，分别从总体中抽取样本容量为n1,n2的样本，样本方差为 s 1 2 s^2_1 s12， s 2 2 s^2_2 s22，则F统计量为
F = s 1 2 σ 1 2 s 2 2 σ 2 2 = s 1 2 σ 2 2 s 2 2 σ 1 2 F=\frac{\frac{s^2_1}{\sigma ^2_1}}{\frac{s ^2_2}{\sigma ^2_2}}=\frac{s^2_1\sigma^2_2}{s^2_2\sigma^2_1} F=σ22s22σ12s12=s22σ12s12σ22

F分布有两个自由度，分子自由度为v1=(n1-1)，分母自由度为v2=(n2-1)，因此，由F统计量组成的F分布可以表示为：

F统计量可看成是由两个卡方统计量相除得到的，F分布也被成为方差比分布，假设两个正态分布总体的卡方统计量为 χ 1 2 \chi^2_1 χ12, χ 2 2 \chi^2_2 χ22

χ 1 2 / v 1 2 χ 2 2 / v 2 2 \frac{\chi^2_1/v ^2_1}{\chi^2_2/v ^2_2} χ22/v22χ12/v12~F(n1-1,n2-1)

    原文作者：柚子you
    原文地址: https://blog.csdn.net/weixin_43992800/article/details/100066804
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。