怎麼量化一個特徵在模型中的重要性？

比如兩個特徵，一個佔60，另一個佔40

LR之後看係數。

樹模型有特徵重要性，一般某分裂特徵越在樹上方，特徵重要性越大。

線性模型有係數權重和方差貢獻率可以使用。

一般，你要做特徵重要性比較的時候，可能遇到兩種情況。

情況1:一共10個特徵，我在該模型中運用了特徵2467。我要比較這4個的重要性。並排序它。

情況2:一共10個特徵，我要挑5個特徵來構建模型。怎麼給這10個特徵排序，然後選出5個。

我覺得可能有這麼幾個思路可以考慮：

如果是線性模型的化，可以看標準化以後的係數；線性回歸中，自變數的係數表示自變數變化一個單位時，因變數變化的大小；係數越大，自變數對因變數的影響越大，也就越重要。但是必須是標準化以後的係數——比如你用克作為質量的單位，和用千克作為質量的單位，回歸出來的係數差了1000倍，但是你不能說前者所代表的變數更重要
也可以看每一個變數對 的影響；比如，先剔除第1個變數，擬合一個模型，得到一個值；然後再把第1個變數加入到模型中重新擬合，得到一個新的；對所有的自變數都做一遍；看看哪個變數對的影響最大——對的影響越大，說明這個變數越重要
XGBoost或者LGBM模型中自帶的feature importance 功能