台湾 || 语言: 大陆简体港澳繁體台灣正體

生成模型演算法

雪花台灣 2019-03-17 00:58

原文鏈接：Generative Learning Algorithm in Chinese

最新的版本在原文鏈接里可以找到。原博客會不斷更新。這篇筆記主要梳理了吳恩達教授在斯坦福的CS229課程的內容，並結合了哥倫比亞大學幾個教授相關筆記內容一併總結。

請注意: 本文是翻譯的一份學習資料，英文原版請點擊Wei的學習筆記:Generative Learning Algorithm

中文版將不斷和原作者的英文筆記同步內容，定期更新和維護。

生成學習演算法

1 判別模型

判別模型是一種對觀測數據進行直接分類的模型，常見的模型有邏輯回歸和感知機學習演算法等。此模型僅對數據進行分類，並不能具象化或者量化數據本身的分布狀態，因此也無法根據分類生成可觀測的圖像。

定義上，判別模型通過構建條件概率分布預測y，即在特徵x出現的情況下標記y出現的概率。此處p可以是邏輯回歸模型。

2 生成模型

與判別模型不同，生成模型首先了解數據本身分布情況，並進一步根據輸入x，給出預測分類y的概率。該模型有著研究數據分布形態的概念，可以根據歷史數據生成新的可觀測圖像。

而貝葉斯分類就是一個典型的例子。在這個例子中，我們首先有一個先驗分類。這個先驗的分布其實就是我們對數據分布的一個假設（如高斯分布，二項分布或多項分布），我們假設我們選擇的模型可以正確解釋數據集中的隱含信息。從數據集中，我們可以知道哪些參數最適合我們選擇的模型。在這個已計算出先驗概率的模型中，我們可以使用貝葉斯公式來進一步計算每個類的概率，然後挑出較大的概率供我們使用。與此同時，給定任意一個先驗概率分布，我們可以根據這個分布生成新的樣本y，進而基於所選擇的先驗生成新的特徵x（比如，基於一個患癌症的先驗概率與分布，我們可以生成新的患病者特徵x）。這就是所謂的生成過程。

3 高斯判別分析

高斯判別分析（GDA）是一個生成模型，其中是多元高斯正態分布。

3.1 多元高斯正態分布

在多元正態分布中，一個隨機變數是一個空間中的矢量值，其中n代表維度數。因此，多元高斯的均值向量，協方差矩陣，其中Σ是對稱的半正定矩陣。其概率密度函數為：

$p(x;mu,Sigma) = frac{1}{(2pi)^{n/2}lvert Sigma vert^{1/2}}expigg(-frac{1}{2}(x - mu)^TSigma^{-1}(x - mu)igg)$

如上所述，μ代表期望值。

隨機向量Z（或者說，向量化的隨機變數Z）的協方差為：

$egin{align} Cov(Z) &= E[(Z-E[Z])(Z-E[Z])^T] \ &= E[ZZ^T - 2ZE[Z]^T + E[Z]E[Z]^T]\ &= E[ZZ^T] - 2E[Z]E[Z]^T + E[Z]E[Z]^T\ &=E[ZZ^T] - E[Z]E[Z]^T end{align}$

下圖顯示了幾個密度函數，它們的均值均為零，但協方差不同：

Sigma = egin{bmatrix} 1 & 0 \ 0 & 1 end{bmatrix}; Sigma = egin{bmatrix} 1 & 0.5 \ 0.5 & 1 end{bmatrix}; Sigma = egin{bmatrix} 1 & 0.8 \ 0.8 & 1 end{bmatrix}

相关文章