台湾 || 语言: 大陆简体港澳繁體台灣正體

Boosting之AdaBoost演算法

雪花臺灣 2019-03-12 14:14

Boosting是一族可將弱學習器提升為強學習器的演算法。這族演算法的工作機制類似：先從初始訓練集訓練出一個基學習器，再根據基學習器的表現對訓練樣本分佈進行調整，使得先前基學習器做錯的訓練樣本在後續得到更多的關注，然後基於調整後的樣本分佈來訓練下一個基分類器；如此重複進行，直至學習器的數目達到事先指定的值，最終將這個基學習器進行加權組合。

AdaBoost

Boosting族演算法最著名的代表是AdaBoost，其演算法描述如下圖，其中 $y_i in {-1, +1 }$ ，是真實函數.

AdaBoost演算法有多種推導方式，比較容易理解的是基於「加性模型」(additive model)，即基學習器的線性組合

$H(x) = sum_{t=1}^{T}alpha_th_t(x) ag{1}$

來最小化指數損失函數(exponential loss function)，

$ell _ { mathrm { exp } } ( H | mathcal { D } ) = mathbb { E } _ { oldsymbol { x } sim mathcal { D } } left[ e ^ { - f ( oldsymbol { x } ) H ( oldsymbol { x } ) } ight] ag{2}$

AdaBoost演算法偽代碼

AdaBoost演算法偽代碼

相關文章