本文列出了數據科學家使用的十大機器學習演算法,並且介紹了這十大演算法的特點,供各位機器學習的新人們更好地理解和應用。
在機器學習領域,有種說法叫做「世上沒有免費的午餐」,簡而言之,它是指沒有任何一種演算法能在每個問題上都能有最好的效果,這個理論在監督學習方面體現得尤為重要。
舉個例子來說,你不能說神經網路永遠比決策樹好,反之亦然。模型運行被許多因素左右,例如數據集的大小和結構。
因此,你應該根據你的問題嘗試許多不同的演算法,同時使用數據測試集來評估性能並選出最優項。
當然,你嘗試的演算法必須和你的問題相切合,其中的門道便是機器學習的主要任務。打個比方,如果你想打掃房子,你可能會用到吸塵器、掃帚或者拖把,但你肯定不會拿把鏟子開始挖坑吧。
對於渴望瞭解機器學習基礎知識的機器學習新人來說,這兒有份數據科學家使用的十大機器學習演算法,為你介紹這十大演算法的特性,便於大家更好地理解和應用,快來看看吧。
1-線性回歸
線性回歸可能是統計學和機器學習中最知名和最易理解的演算法之一。
由於預測建模主要關注最小化模型的誤差,或者以可解釋性為代價來做出最準確的預測。 我們會從許多不同領域借用、重用和盜用演算法,其中涉及一些統計學知識。
線性回歸用一個等式表示,通過找到輸入變數的特定權重(B),來描述輸入變數(x)與輸出變數(y)之間的線性關係。