先上结论:

t分布并不是仅仅用于小样本(虽然小样本中用的风生水起)中,大样本依旧可以使用。t分布与正太分布相比多了自由度参数,在小样本中,能够更好的剔除异常值对于小样本的影响,从而能够准确的抓住数据的集中趋势和离散趋势。

卡方检验在很多课本中被认为是非参数检验的一员,但从分布假设来说,他属于参数检验。卡方分布(x2)是K个服从 正太分布的随机变数的平方和所服从分布。其参数只有自由度一个,当自由度很大时,X2近似服从正太分布。

F分布是两个服从卡方分布的随机变数各自除以他们的自由度的商。

正太分布是以上所有分布的基础。

具体性质:

以下内容仅为参考:

t分布-命名与源起

「t」,是伟大的Fisher为之取的名字。Fisher最早将这一分布命名为「Students distribution」,并以「t」为之标记。Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏林的一家酒厂工作,设计了一种后来被称为t检验的方法来评价酒的质量。因为行业机密,酒厂不允许他的工作内容外泄,所以当他后来将其发表到至今仍十分著名的一本杂志《Biometrika》时,就署了student的笔名。所以现在很多人知道student,知道t,却不知道Gosset。(相对而言,我们常说的正态分布

,在国外更多的被称为高斯分布)

t分布的性质:厚尾性

具体长处:

  1. 研究样本量的估计量更小。标准差是样本量计算的一个重要参数,t分布能够很好的消除异常值带来的标准差波动,最终减少样本量。
  2. 点估计更准确。如果小样本使用正态分布来拟合,很容易就受到离群异常值的影响而得到错误的估计。
  3. 回归中应用t分布,可以得到更稳健的估计量(β值或OR值),这也是我们实现「稳健回归」的一个重要手段。

卡方分布

若n个相互独立的随机变数ξ?、ξ?、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变数的平方和

Q=∑i=1nξ2i

构成一新的随机变数,其卡方分布规律称为x^2,分布(chi-square distribution),其中参数n称为自由度,正如正态分布中均值或方差不同就是另一个x2正态分布一样,自由度不同就是另一个分布。记为 Q~x^2(k). 卡方分布是由正态分布构造而成的一个新的分布,当自由度n很大时,X^2分布近似为正态分布。 对于任意正整数k, 自由度为 k的卡方分布是一个随机变数X的机率分布。

F分布

研究A、B、C三种不同学校学生的阅读理解成绩找到一种解决的办法,有人可能会以为,只要多次使用Z检验或t检验,比较成对比较学校(或条件)即可。但是我们不会这样来处理。因为Z检验或t检验有其局限性:

(1)比较的组合次数增多,上例需要3次,如果研究10个学校,需要45个

(2)降低可靠程度,如果我们做两次检验,每次都为0.05的显著性水平,那么不犯Ⅰ型错误的概率就变为0.95×0.95=0.90。此时犯Ⅰ型错误的概率则为1-0.90=0.10,即至少犯一次Ⅰ型错误的概率翻了一倍。若做10次检验的话,至少犯一次Ⅰ型错误的概率将上升到0.40(1-0.952),而10次检验结论中都正确的概率只有60%。所以说采用Z检验或t检验随著均数个数的增加,其组合次数增多,从而降低了统计推论可靠性的概率,增大了犯错误的概率

完全随机设计是采用完全随机化的分组方法,将全部实验对象分配到g个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义。

参考文献:

t分布, 卡方x分布,F分布 - Thinkando - 博客园


推荐阅读:
相关文章