參數估計(二).最大似然估計
最大似然估計可以說是應用非常廣泛的一種參數估計的方法。它的原理也很簡單:利用已知的樣本,找出最有可能找出生成該樣本的參數。
1.似然函數
似然性(likelihood)與概率(possibility)同樣可以表示事件發生的可能性大小,但是二者有著很大的區別,概率用於在已知參數的情況下,預測接下來的觀測所得到的結果;而似然性則是已知某些觀測的結果,對參數進行估計。
事實上,似然和概率是可以相互轉換的。假設事件 發生,那麼某個事件 會發生的概率為下式:
我們稍作轉換,得到下式:
注意式中,事件 已經發生, 未知是否發生。 表示事件 發生的情況下,事件 發生的概率;而 則表示,事件 的發生會導致 發生的概率。
可能聽著不是那麼好理解。我們用一個似然函數來表示,即
其中 已知, 未知。若 ,意味著 時,隨機變數 得到 的概率大於當 時。這也正是似然的意義所在,通過已有的觀測數據 ,估計出最有可能生成 的分佈函數參數 。下結論:
- 在 已知, 為變數的情況下, 為概率,表示通過已知的分佈函數與參數,隨機生成出 的概率;
- 在 為變數, 已知的情況下, 為似然函數,它表示對於不同的 ,出現 的概率是多少。此時可寫成 ,更嚴格地,我們也可寫成 。
給出維基百科的例子來加深理解: