为什么在使用最小二乘法得出参数值后,仍然要进行显著性t检验?
其实这不算科普,只能算扫盲贴。。。但是这个问题还是挺重要的!这个帖子是为了回答
为什么在使用最小二乘法得出参数值后,仍然要进行显著性t检验?如果不显著性影响,算出参数值接近零?如何验证真实参数为零,但是其估计值不会是零
你可以做一个简单的实验,从下面的模型里simulate 100次
然后你在simulate 100次这个x
然后你回归这个模型
你会得到一个
很明显,真实参数
事实上
现在说点实际的,假设你不知道
这个估计值再接近零,你都不能说真实参数就是零,那是武断的不负责任的。万一真实的
所以,你必须要要用假设检验来判断,you cannot do better without it!
假设我求得一个较大的参数估计值,并不靠近于零,那么我如何判断X是否真的对Y有影响?
还是上面那个例子,我们稍微具体化一下:
假如说,上式是真实模型, 且
我们根据这套数据做回归会得到一个很接近2的
在实际处理中,我们可能不使用这堆数据,譬如,
等价于
把上式带入原式有
所以,在做完变换单位的数据处理之后,我们真正要回归的是
其中
根据上面那一堆数据的变换
问题就在这里,其实完全是等价的两套数据,就因为数量级不同,不经过假设检验,我们会得出截然相反的两种推论。
所以,不做假设检验,单单看估计值的数量级作出判断是不靠谱的!
而如果你做假设检验,比如t检验,只要数据相同
推荐阅读: