假设检验,显著性水平,p-value
最近看了些统计学的东东,做了点笔记记。各位看官看完觉得好的给个赞,觉得有问题的评论给出建议呗~
假设我们知道总体的分布函数的形式,但是不知道其具体参数,为了推断总体的的某些未知特性,我们通常会提出一些关于总体的假设,例如「均值为0」、「硬币投出正面概率为0.5」。接著为了决定是否接受/拒绝这些假设,我们会从总体中做抽样得到很多的样本,并通过这些样本去决定是否接受假设,这个从提出假设、根据样本做出决策的整个过程就是假设检验。
假设总体的分布函数的参数为 ,我们要判断这个 是否是正常的,为此我们制定了两个假设:
我们称之为零假设。这两个假设是指,该参数是否落在某个范围内,如果在就说明是正常的,否则则非正常。
为了去验证假设 是否成立,我们抽样得到一批样本 ,希望通过这批样本去验证假设。在 成立的情况下,抽样得到的样本犯错误的概率应该是很小的(例如如果硬币投出正面的概率是0.5,那么投100次、1000次投出正面的次数怎么说也不会偏离期望太多),这个很小很小的概率为 ,即
就是显著性水平,一般为很小的数,例如0.05、0.1等。判断是否犯错误的标准有很多,例如可以判断样本均值与期望是否差太远。
接下来就是检验了,去检验 是否成立有两个方法,但都是等价的,后面会具体说明:
- 判断这批样本是否犯错,如果犯错了则可拒绝 ;
- 计算p-value,即在 成立的情况下产生 的概率,可理解成 ,若p-value小于 ,则也可拒绝 。
思想在于,如果 成立,那么产生的样本犯错误的概率是很小很小的,但是这么小的概率都发生的话,则有理由怀疑 是否成立。
在 为真的情况下,我们若还是拒绝了 ,称之为第I类错误;若在 不为真的情况下,我们接受了 ,称之为第II类错误。可以知道,犯第I类错误的概率为 ,我们一般控制第I类错误发生的概率,定 很小很小,0.05、0.1等。这种只对犯第I类错误的概率加以控制,但是不考虑犯第II类错误的概率的检验,称为显著性检验。
Example
我们用两个栗子来说明。