回归分析|笔记整理（D）——LASSO回归，分位数回归概述

各位，元旦快乐！2019年一定要顺心顺意啊！

在这一节我们会简单介绍一些比较前沿的统计方法——LASSO和分位数回归。要注意的是这两种方法的理论证明作为一个统计系的本科生来说掌握太困难了（当然了，作为学计算数学的，难度也一样）。所以我们这一节只会在感性上让大家了解它们究竟是怎么一回事，因此这一篇更多算是一个「概述」。

提供之前的笔记：

回归分析|笔记整理（1）——引入，一元线性回归（上）
回归分析|笔记整理（2）——一元线性回归（下）
回归分析|笔记整理（3）——多元正态分布理论（上）
回归分析|笔记整理（4）——多元正态分布理论（中）
回归分析|笔记整理（5）——多元正态分布理论（下）
回归分析|笔记整理（6）——多元线性回归（上）
回归分析|笔记整理（7）——多元线性回归（下），违背基本假设的情况
回归分析|笔记整理（8）——变数选择
回归分析|笔记整理（9）——带约束的线性回归，多重共线性
回归分析|笔记整理（A）——岭回归，主成分回归（上）
回归分析|笔记整理（B）——主成分回归（下），偏最小二乘回归
回归分析|笔记整理（C）——非线性回归，含定性变数的回归模型

我们开始本节的内容。

LASSO回归

做机器学习的不可能对这个词感到陌生。如果用中文来说，它就是「套索」回归的意思。不过有的人叫它LASSO可能是因为它的图形像一个套索，但是这只是一个巧合，它的实际的全称是Least Absolute Selection and Shrinkage Operator，最小绝对值选择与收缩运算元。这个名字为什么这么叫，我们之后就知道了。

岭回归回顾

我们在第A节说过岭回归的解是

$hat eta = (XX+lambda I)^{-1}XY$

但是弄机器学习的却发现它们一般考虑岭回归的解是最小化下面这个目标函数得到的。

$Q _ { r } = frac { 1 } { 2 N } sum _ { i = 1 } ^ { N } left( y _ { i } - eta _ { 0 } - sum _ { j = 1 } ^ { p } x _ { i j } eta _ { j } ight) ^ { 2 } + lambda | eta | _ { 2 } ^ { 2 }$