你可以看到,二者都可以让回归系数慢慢的趋于0,但是不一样的是LASSO回归针对不同的自变数,会使其收敛的速度不一样。有的变数就很快趋于0了,有的却会很慢。因此一定程度上LASSO回归非常适合于做变数选择。相比之下,看岭回归的图就容易看得出来,它也会有这个趋势,但是严格趋于0的时候一定是要求它的 要非常非常大(这个图可能初看有些让人误解,注意它的横坐标并不是 而是 )。而LASSO就不会有这个烦恼。
所以为什么是这么一个情况呢?这里我们不会严格证明,只会简单解释一下。我们考虑一个只有二元变数的情形。那么这样的话,如果我们画出关于这两个变数取值的平面,两种回归模型的最小二乘解就会对应著平面上的某两个点。
但是实际情况下,因为这两种回归在拉格朗日对偶形式下人工添加了一个限制条件,因此相当于它们的取值多了一个限制。现在的问题关键来了,这个「限制」我们如何用几何图形描述?