Dirichlet 過程
1.問題的提出
假設
2.
Dirichlet 過程是Dirichlet的分布的無窮維的推廣。我們首先介紹Dirichelet分布。Dirichlet分布是Beta分布的推廣。令
性質1:如果
3.有限的貝葉斯混合分布生成過程
(1)
(2)
(3)
(4)
4.
Dirichlet過程為概率測度的隨機過程。Dirichlet 過程是Dirichlet 分布的無窮維的推廣。
令
記
性質(1). 令
性質(2). 令
5.
下面我們利用折棍子方法給出
(1)
(2)
(3)
(4)
定理
5. 應用
DP過程主要應用三個領域:模型的貝葉斯驗證, 密度估計以及混合模型的聚類。
(1)模型的貝葉斯驗證
如何對檢驗一個模型對給定樣本數據擬合的效果呢?通常做法是利用貝葉斯公式計算感興趣分布下的樣本數據邊際概率,然後計算其它分布下的樣本數據邊際概率。與其它分布相比,如果感興趣的模型下的數據邊際概率最高,那麼就說明該分布對樣本數據擬合較好。該方式核心的問題就是對比較分布的選擇。一般地我們希望比較分布的集合儘可能的大,並且具有先驗分布。DP過程是一個很好的選擇,通常的做法是選該興趣的分布為基礎分布
(2)密度估計
令
(3)混合模型的聚類
Dirichlet過程最重要的應用就是利用混合模型對數據進行聚類。令
6. 展望
Dirichlet過程和貝葉斯非參在機器學習和統計中是一個非常活躍的領域。目前主要有以下四個方向:
(1)DP模型的有效統計推斷問題。常見方法有MCMC抽樣,變分方法。
(2)DP模型的擴展。
(3)收斂和相合性等理論問題。
(4)模型的應用:聚類,認知,回歸和分類等
推薦閱讀: