生成模型演算法
原文鏈接:Generative Learning Algorithm in Chinese
最新的版本在原文鏈接里可以找到。原博客會不斷更新。這篇筆記主要梳理了吳恩達教授在斯坦福的CS229課程的內容,並結合了哥倫比亞大學幾個教授相關筆記內容一併總結。
請注意: 本文是翻譯的一份學習資料,英文原版請點擊Wei的學習筆記:Generative Learning Algorithm
中文版將不斷和原作者的英文筆記同步內容,定期更新和維護。
生成學習演算法
1 判別模型
判別模型是一種對觀測數據進行直接分類的模型,常見的模型有邏輯回歸和感知機學習演算法等。此模型僅對數據進行分類,並不能具象化或者量化數據本身的分布狀態,因此也無法根據分類生成可觀測的圖像。
定義上,判別模型通過構建條件概率分布 預測y,即在特徵x出現的情況下標記y出現的概率。此處p可以是邏輯回歸模型。
2 生成模型
與判別模型不同,生成模型首先了解數據本身分布情況,並進一步根據輸入x,給出預測分類y的概率。該模型有著研究數據分布形態的概念,可以根據歷史數據生成新的可觀測圖像。
而貝葉斯分類就是一個典型的例子。在這個例子中,我們首先有一個先驗分類。這個先驗的分布其實就是我們對數據分布的一個假設(如高斯分布,二項分布或多項分布),我們假設我們選擇的模型可以正確解釋數據集中的隱含信息。從數據集中,我們可以知道哪些參數最適合我們選擇的模型。在這個已計算出先驗概率的模型中,我們可以使用貝葉斯公式來進一步計算每個類的概率,然後挑出較大的概率供我們使用。與此同時,給定任意一個先驗概率分布,我們可以根據這個分布生成新的樣本y,進而基於所選擇的先驗生成新的特徵x(比如,基於一個患癌症的先驗概率與分布,我們可以生成新的患病者特徵x)。這就是所謂的生成過程。
3 高斯判別分析
高斯判別分析(GDA)是一個生成模型,其中 是多元高斯正態分布。
3.1 多元高斯正態分布
在多元正態分布中,一個隨機變數是一個 空間中的矢量值,其中n代表維度數。因此,多元高斯的均值向量 ,協方差矩陣 ,其中Σ是對稱的半正定矩陣。其概率密度函數為:
如上所述,μ代表期望值。
隨機向量Z(或者說,向量化的隨機變數Z)的協方差為:
下圖顯示了幾個密度函數,它們的均值均為零,但協方差不同: