這是特徵選擇的一整個流程的總結,所謂嵌入式特徵選擇,就是通過一些特殊的模型擬合數據然後根據模型自身的某些對於特徵的評價的屬性來作為評價指標,最後再使用包裹式的特徵選擇方法來選擇,當然,很多時候我們還是僅停留在計算出評價指標的階段,因為包裹式特徵選擇的最大問題就是計算量和時間是三者之中最大的。
這裡就存在一個很嚴重的問題了,我們取了5組不同的的正則化係數的情況下,得到的特徵重要性(也就是線性模型的權重值)的變化情況很嚴重,比如從上往下數第4、5個特徵的變動幅度太大了,雖然越大的正則化係數越容易得到小的權重係數,但是問題是這裡的第4、5個特徵的相對其它特徵的權重係數的取值的排序也發生了非常大的變化,尤其是第5個特徵,在正則化係數取值為0.01的時候其權重係數為-14.3945,可以說負貢獻很大,但是當正則化係數為其他值是,權重係數大幅下降甚至變成了0。