最小二乘法

最小二乘法

8 人赞了文章

以下内容来自刘建平Pinard-博客园的学习笔记，总结如下：

最小二乘法是用来做函数拟合或者求函数极值的方法。在机器学习，尤其是回归模型中，最常用的就是最小二乘回归求解模型参数。

1 最小二乘的原理与要解决的问题

最小二乘法是由勒让德在19世纪发现的，原理的一般形式很简单，发现的过程是非常艰难的。形式如下式：

$目标函数=sum_{}^{}{(观测值-理论值)^{2}}$

观测值就是我们的多组样本，理论值就是我们的假设拟合函数。

目标函数也就是在机器学习中常说的损失函数.

我们的目标是得到使目标函数最小化时候的拟合函数的模型。

比如有m个只有一个特征的样本：

2 最小二乘法的代数法求解

3 最小二乘法的矩阵法解法

矩阵法比代数法要简洁，且矩阵运算可以取代循环，所以现在很多书和机器学习库都是用的矩阵法来做最小二乘法。这里用上面的多元线性回归例子来描述矩阵法解法。

4 最小二乘法的局限性和适用场景

从上面可以看出，最小二乘法适用简洁高效，比梯度下降这样的迭代演算法似乎方便很多，下面讨论最小二乘法的局限性。

首先，最小二乘法需要计算 $X^{T}X$ 的逆矩阵，有可能它的逆矩阵不存在，这样就没有办法直接用最小二乘法了，此时梯度下降法仍然可以使用。可以通过对样本数据进行整理，去掉冗余特征，让 $X^{T}X$ 的行列式不为0，然后继续使用最小二乘法。

第二，当样本特征非常大的时候，计算 $X^{T}X$ 的逆矩阵是一个非常耗时的工作，甚至不可行。此时以梯度下降为代表的迭代法仍然可以使用。那这个n到底多大就不适合最小二乘法呢？如果你没有很多的分散式大数据计算资源，建议超过10000个特征就用迭代法吧。或者通过主成分分析降低特征的维度后再用最小二乘法。

第三，如果拟合函数不是线性的，这时无法使用最小二乘法，需要通过一些技巧转化为线性才能使用，此时梯度下降仍然可以用。

第四，讲一些特殊情况。当样本量很少，小于特征数的时候，这时拟合方程是欠定的，常用的优化方法都无法去拟合数据。当样本量等于特征数的时候，用方程组求解就可以了。当大于时，拟合方程是超定的，也就是我们常用与最小二乘法的场景了。

1 最小二乘的原理与要解决的问题

2 最小二乘法的代数法求解

3 最小二乘法的矩阵法解法

4 最小二乘法的局限性和适用场景

热门新闻

周热门

最小二乘法

1 最小二乘的原理与要解决的问题

2 最小二乘法的代数法求解

3 最小二乘法的矩阵法解法

4 最小二乘法的局限性和适用场景

最小二乘法（Least Squares Method）

为了方差无偏估计为什么要用n-1？

线性代数视角下的最小二乘法

增加很多无用的特征会导致训练集误差下降么？

机器学习入门之旅（四）线性模型之损失函数的迭代演算法

Kernel Dual Representation

线性模型（4. 数据预处理）

线性模型中参数Θ=(XTX)?1XTY的推导过程？

机器学习—多变数线性回归

吴恩达机器学习系列4：线性回归的梯度下降演算法

Python线性回归——单车案例

为什么在使用最小二乘法得出参数值后，仍然要进行显著性t检验？

回归 | 线性回归理论与演算法实现

机器学习入门——简单线性回归和逻辑回归

卡尔曼滤波（1）--递归最小二乘（RLS）推导过程

热门新闻

周热门