機器學習工程師面試寶典-07-決策樹

本章介紹決策樹演算法, 包括單變數決策樹(C4.5、ID3、CART)、多變數決策樹、以決策樹為集學習器的Bagging集成(隨機森林)和以決策樹為集學習器的Boosting集成(GBDT、XGBoost、LightGBM).

本系列文章有以下特點: (a). 為了減輕讀者的負擔並能使儘可能多的讀者從中收益, 本文試圖儘可能少地使用數學知識, 只要求讀者有基本的微積分、線性代數和概率論基礎, 並在第一節對關鍵的數學知識進行回顧和介紹. (b). 本文不省略任何推導步驟, 適時補充背景知識, 力圖使本節內容是自足的, 使機器學習的初學者也能理解本文內容. (c). 機器學習近年來發展極其迅速, 已成為一個非常廣袤的領域. 本文無法涵蓋機器學習領域的方方面面, 僅就一些關鍵的機器學習流派的方法進行介紹. (d). 為了幫助讀者鞏固本文內容, 或引導讀者擴展相關知識, 文中穿插了許多問題, 並在最後一節進行問題的"快問快答".

本章全文pdf可從如下鏈接下載

https://github.com/HaoMood/homepage/raw/master/files/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E5%B7%A5%E7%A8%8B%E5%B8%88%E9%9D%A2%E8%AF%95%E5%AE%9D%E5%85%B8-07-%E5%86%B3%E7%AD%96%E6%A0%91.pdf?

github.com