关于python机器学习演算法,我们学了KNN,kmeans,朴素贝叶斯,除了这些还有哪些演算法简单?我想通过PM2.5,PM10,SO2,O3这些污染物对空气质量指数预测,可以用线性回归和决策树演算法吗?或者还有什么适合的比较简单的演算法?
尽管线性模型是最简单的机器学习技术之一,但它们仍然是进行预测的强大工具。
代码格式乱可以看原文链接:
http://tecdat.cn/?p=11387?tecdat.cn
这尤其是由于线性模型特别容易解释这一事实。在这里,我将讨论使用空气质量数据集的普通最小二乘回归示例解释线性模型时最重要的方面。
空气质量数据集
空气质量数据集包含对在纽约获得的以下四个空气质量指标的154次测量:
- 臭氧:平均臭氧水平,以十亿分之一为单位
- Solar.R:太阳辐射
- 风:平均风速,每小时英里
- 温度:每日最高温度,以华氏度为单位
我们将通过删除所有NA
并排除 Month
和Day
列来清理数据集 ,这些列和 列不应充当预测变数。
data(airquality) ozone &