假設檢驗,顯著性水平,p-value
最近看了些統計學的東東,做了點筆記記。各位看官看完覺得好的給個贊,覺得有問題的評論給出建議唄~
假設我們知道總體的分布函數的形式,但是不知道其具體參數,為了推斷總體的的某些未知特性,我們通常會提出一些關於總體的假設,例如「均值為0」、「硬幣投出正面概率為0.5」。接著為了決定是否接受/拒絕這些假設,我們會從總體中做抽樣得到很多的樣本,並通過這些樣本去決定是否接受假設,這個從提出假設、根據樣本做出決策的整個過程就是假設檢驗。
假設總體的分布函數的參數為 ,我們要判斷這個 是否是正常的,為此我們制定了兩個假設:
我們稱之為零假設。這兩個假設是指,該參數是否落在某個範圍內,如果在就說明是正常的,否則則非正常。
為了去驗證假設 是否成立,我們抽樣得到一批樣本 ,希望通過這批樣本去驗證假設。在 成立的情況下,抽樣得到的樣本犯錯誤的概率應該是很小的(例如如果硬幣投出正面的概率是0.5,那麼投100次、1000次投出正面的次數怎麼說也不會偏離期望太多),這個很小很小的概率為 ,即
就是顯著性水平,一般為很小的數,例如0.05、0.1等。判斷是否犯錯誤的標準有很多,例如可以判斷樣本均值與期望是否差太遠。
接下來就是檢驗了,去檢驗 是否成立有兩個方法,但都是等價的,後面會具體說明:
- 判斷這批樣本是否犯錯,如果犯錯了則可拒絕 ;
- 計算p-value,即在 成立的情況下產生 的概率,可理解成 ,若p-value小於 ,則也可拒絕 。
思想在於,如果 成立,那麼產生的樣本犯錯誤的概率是很小很小的,但是這麼小的概率都發生的話,則有理由懷疑 是否成立。
在 為真的情況下,我們若還是拒絕了 ,稱之為第I類錯誤;若在 不為真的情況下,我們接受了 ,稱之為第II類錯誤。可以知道,犯第I類錯誤的概率為 ,我們一般控制第I類錯誤發生的概率,定 很小很小,0.05、0.1等。這種只對犯第I類錯誤的概率加以控制,但是不考慮犯第II類錯誤的概率的檢驗,稱為顯著性檢驗。
Example
我們用兩個栗子來說明。