關於python機器學習演算法,我們學了KNN,kmeans,樸素貝葉斯,除了這些還有哪些演算法簡單?我想通過PM2.5,PM10,SO2,O3這些污染物對空氣質量指數預測,可以用線性回歸和決策樹演算法嗎?或者還有什麼適合的比較簡單的演算法?
儘管線性模型是最簡單的機器學習技術之一,但它們仍然是進行預測的強大工具。
代碼格式亂可以看原文鏈接:
http://tecdat.cn/?p=11387?tecdat.cn
這尤其是由於線性模型特別容易解釋這一事實。在這裡,我將討論使用空氣質量數據集的普通最小二乘回歸示例解釋線性模型時最重要的方面。
空氣質量數據集
空氣質量數據集包含對在紐約獲得的以下四個空氣質量指標的154次測量:
- 臭氧:平均臭氧水平,以十億分之一為單位
- Solar.R:太陽輻射
- 風:平均風速,每小時英里
- 溫度:每日最高溫度,以華氏度為單位
我們將通過刪除所有NA
並排除 Month
和Day
列來清理數據集 ,這些列和 列不應充當預測變數。
data(airquality) ozone &