假设检验,显著性水平,p-value

　　最近看了些统计学的东东，做了点笔记记。各位看官看完觉得好的给个赞，觉得有问题的评论给出建议呗~

　　假设我们知道总体的分布函数的形式，但是不知道其具体参数，为了推断总体的的某些未知特性，我们通常会提出一些关于总体的假设，例如「均值为0」、「硬币投出正面概率为0.5」。接著为了决定是否接受/拒绝这些假设，我们会从总体中做抽样得到很多的样本，并通过这些样本去决定是否接受假设，这个从提出假设、根据样本做出决策的整个过程就是假设检验。

　　假设总体的分布函数的参数为，我们要判断这个是否是正常的，为此我们制定了两个假设：

$H_{0}: hetainOmega \ H_{1}: heta otinOmega$

$H_{0}$ 我们称之为零假设。这两个假设是指，该参数是否落在某个范围内，如果在就说明是正常的，否则则非正常。

　　为了去验证假设 $H_{0}$ 是否成立，我们抽样得到一批样本 $??={??_1,?,??_n}$ ，希望通过这批样本去验证假设。在成立的情况下，抽样得到的样本犯错误的概率应该是很小的（例如如果硬币投出正面的概率是0.5，那么投100次、1000次投出正面的次数怎么说也不会偏离期望太多），这个很小很小的概率为，即

就是显著性水平，一般为很小的数，例如0.05、0.1等。判断是否犯错误的标准有很多，例如可以判断样本均值与期望是否差太远。

　　接下来就是检验了，去检验是否成立有两个方法，但都是等价的，后面会具体说明：

判断这批样本是否犯错，如果犯错了则可拒绝；
计算p-value，即在成立的情况下产生的概率，可理解成，若p-value小于，则也可拒绝。

思想在于，如果成立，那么产生的样本犯错误的概率是很小很小的，但是这么小的概率都发生的话，则有理由怀疑是否成立。

　　在为真的情况下，我们若还是拒绝了，称之为第I类错误；若在不为真的情况下，我们接受了，称之为第II类错误。可以知道，犯第I类错误的概率为，我们一般控制第I类错误发生的概率，定很小很小，0.05、0.1等。这种只对犯第I类错误的概率加以控制，但是不考虑犯第II类错误的概率的检验，称为显著性检验。

Example

我们用两个栗子来说明。

假设检验,显著性水平,p-value

Example

栗子1

栗子2

参考

热门新闻

周热门

假设检验,显著性水平,p-value

Example

栗子1

栗子2

参考

中美瑞德西韦试验结果迥异掀热议

瑞德西韦测试疑无效 药厂反驳未有结论

港大学者预计港感染数字较确诊为高

全港学校延长停课两周

下月九日倘未复课 小六呈分将取消

梁卓伟：全港须高度戒备 倘松懈会增出现确诊个案机会

美洲国家组织报告指 选举电脑被大规模操纵

时间序列分析 自协方差/自相关系数/偏自相关系数

偏差与方差， 欠拟合与过拟合

10-概率分布之离散概率和连续概率

联合概率、条件概率和边缘概率

EM演算法的个人理解和实验

浅析机器学习：线性回归 & 逻辑回归

一个有趣的赌博游戏！

[概论] 随机矩阵理论

热门新闻

周热门

瑞德西韦测试疑无效药厂反驳未有结论

下月九日倘未复课小六呈分将取消

梁卓伟：全港须高度戒备　倘松懈会增出现确诊个案机会

美洲国家组织报告指选举电脑被大规模操纵

时间序列分析自协方差/自相关系数/偏自相关系数

偏差与方差，欠拟合与过拟合