特征选择入门

工欲善其事，必先利其器

机器学习炼丹炉要想练出好模型，除了要有好的学习方法外，好的调料（特征）也是必不可少的。

「维度灾难」大家都不陌生，它的外文名叫「The Curse of Dimensionality」。我觉得翻译成为维度诅咒，更为贴切。随著训练样本特征数的由少到多，机器学习模型的准确率会先显著提升，但是当特征数继续增加，模型训练时间大幅上升，准确率不但不会上升，反而会下降，并且无可避免地陷入「过拟合」的泥潭，更为严重的是当某些无关特征加入学习器时，会对模型的准确度造成极大影响。