最近看了些統計學的東東,做了點筆記記。各位看官看完覺得好的給個贊,覺得有問題的評論給出建議唄~

  假設我們知道總體的分布函數的形式,但是不知道其具體參數,為了推斷總體的的某些未知特性,我們通常會提出一些關於總體的假設,例如「均值為0」、「硬幣投出正面概率為0.5」。接著為了決定是否接受/拒絕這些假設,我們會從總體中做抽樣得到很多的樣本,並通過這些樣本去決定是否接受假設,這個從提出假設、根據樣本做出決策的整個過程就是假設檢驗

  假設總體的分布函數的參數為 	heta ,我們要判斷這個 	heta 是否是正常的,為此我們制定了兩個假設:

H_{0}:	hetainOmega \ H_{1}:	heta
otinOmega

H_{0} 我們稱之為零假設。這兩個假設是指,該參數是否落在某個範圍內,如果在就說明是正常的,否則則非正常。

  為了去驗證假設 H_{0} 是否成立,我們抽樣得到一批樣本 ??={??_1,?,??_n} ,希望通過這批樣本去驗證假設。在 H_0 成立的情況下,抽樣得到的樣本犯錯誤的概率應該是很小的(例如如果硬幣投出正面的概率是0.5,那麼投100次、1000次投出正面的次數怎麼說也不會偏離期望太多),這個很小很小的概率為 alpha ,即

P{樣本犯錯誤}=alpha

alpha 就是顯著性水平,一般為很小的數,例如0.05、0.1等。判斷是否犯錯誤的標準有很多,例如可以判斷樣本均值與期望是否差太遠。

  接下來就是檢驗了,去檢驗 H_0 是否成立有兩個方法,但都是等價的,後面會具體說明:

  1. 判斷這批樣本是否犯錯,如果犯錯了則可拒絕 H_0
  2. 計算p-value,即在 H_0 成立的情況下產生 X 的概率,可理解成 ??(??|??_0) ,若p-value小於 alpha ,則也可拒絕 H_0

思想在於,如果 H_0 成立,那麼產生的樣本犯錯誤的概率是很小很小的,但是這麼小的概率都發生的話,則有理由懷疑 H_0 是否成立。

  在 H_0 為真的情況下,我們若還是拒絕了 H_0 ,稱之為第I類錯誤;若在 H_0 不為真的情況下,我們接受了 H_0 ,稱之為第II類錯誤。可以知道,犯第I類錯誤的概率為 alpha ,我們一般控制第I類錯誤發生的概率,定 alpha 很小很小,0.05、0.1等。這種只對犯第I類錯誤的概率加以控制,但是不考慮犯第II類錯誤的概率的檢驗,稱為顯著性檢驗

Example

我們用兩個栗子來說明。

栗子1

特別地,當 frac{ar{x}-mu}{sigma/sqrt{n}}>k 成立時,也稱落在檢驗統計量落在了拒絕域內。接著按照第二種方法,通過p值去檢查

可以看出,其實第一種方法和第二種方法沒本質區別,第二種方法比較p-value(即產生當前樣本或更差樣本的概率)與 alpha 的大小,其實就是在判斷樣本是否犯錯。第二種也可以理解為,產生這種樣本這麼小的概率都發生了(小於 alpha ),那麼有理由懷疑零假設是否成立。

栗子2

參考

1. zh.wikipedia.org/wiki/%

2. 顯著性水平_百度百科

3. blog.csdn.net/lanchunhu

4. 統計學假設檢驗中 p 值的含義具體是什麼?

5. 如何看待「p 值已死」這種說法?

6. 《概率論與數理統計》


推薦閱讀:
相关文章