假設檢驗,顯著性水平,p-value

　　最近看了些統計學的東東，做了點筆記記。各位看官看完覺得好的給個贊，覺得有問題的評論給出建議唄~

　　假設我們知道總體的分布函數的形式，但是不知道其具體參數，為了推斷總體的的某些未知特性，我們通常會提出一些關於總體的假設，例如「均值為0」、「硬幣投出正面概率為0.5」。接著為了決定是否接受/拒絕這些假設，我們會從總體中做抽樣得到很多的樣本，並通過這些樣本去決定是否接受假設，這個從提出假設、根據樣本做出決策的整個過程就是假設檢驗。

　　假設總體的分布函數的參數為，我們要判斷這個是否是正常的，為此我們制定了兩個假設：

$H_{0}: hetainOmega \ H_{1}: heta otinOmega$

$H_{0}$ 我們稱之為零假設。這兩個假設是指，該參數是否落在某個範圍內，如果在就說明是正常的，否則則非正常。

　　為了去驗證假設 $H_{0}$ 是否成立，我們抽樣得到一批樣本 $??={??_1,?,??_n}$ ，希望通過這批樣本去驗證假設。在成立的情況下，抽樣得到的樣本犯錯誤的概率應該是很小的（例如如果硬幣投出正面的概率是0.5，那麼投100次、1000次投出正面的次數怎麼說也不會偏離期望太多），這個很小很小的概率為，即

就是顯著性水平，一般為很小的數，例如0.05、0.1等。判斷是否犯錯誤的標準有很多，例如可以判斷樣本均值與期望是否差太遠。

　　接下來就是檢驗了，去檢驗是否成立有兩個方法，但都是等價的，後面會具體說明：

判斷這批樣本是否犯錯，如果犯錯了則可拒絕；
計算p-value，即在成立的情況下產生的概率，可理解成，若p-value小於，則也可拒絕。

思想在於，如果成立，那麼產生的樣本犯錯誤的概率是很小很小的，但是這麼小的概率都發生的話，則有理由懷疑是否成立。

　　在為真的情況下，我們若還是拒絕了，稱之為第I類錯誤；若在不為真的情況下，我們接受了，稱之為第II類錯誤。可以知道，犯第I類錯誤的概率為，我們一般控制第I類錯誤發生的概率，定很小很小，0.05、0.1等。這種只對犯第I類錯誤的概率加以控制，但是不考慮犯第II類錯誤的概率的檢驗，稱為顯著性檢驗。

Example

我們用兩個栗子來說明。

假設檢驗,顯著性水平,p-value

Example

栗子1

栗子2

參考

热门新闻

周热门

假設檢驗,顯著性水平,p-value

Example

栗子1

栗子2

參考

中美瑞德西韋試驗結果迥異掀熱議

瑞德西韋測試疑無效 藥廠反駁未有結論

港大學者預計港感染數字較確診為高

全港學校延長停課兩周

下月九日倘未復課 小六呈分將取消

梁卓偉：全港須高度戒備 倘鬆懈會增出現確診個案機會

美洲國家組織報告指 選舉電腦被大規模操縱

時間序列分析 自協方差/自相關係數/偏自相關係數

偏差與方差， 欠擬合與過擬合

10-概率分布之離散概率和連續概率

聯合概率、條件概率和邊緣概率

EM演算法的個人理解和實驗

淺析機器學習：線性回歸 & 邏輯回歸

一個有趣的賭博遊戲！

[概論] 隨機矩陣理論

热门新闻

周热门

瑞德西韋測試疑無效藥廠反駁未有結論

下月九日倘未復課小六呈分將取消

梁卓偉：全港須高度戒備　倘鬆懈會增出現確診個案機會

美洲國家組織報告指選舉電腦被大規模操縱

時間序列分析自協方差/自相關係數/偏自相關係數

偏差與方差，欠擬合與過擬合