特徵選擇之-CFS（Correlation-based Feature Selection）

文章：Correlation-based Feature Selection for Discrete and Numeric Class Machine Learning

CFS是能確定所選子集特徵個數的特徵選擇方法，其估計特徵子集並對特徵子集而不是單個特徵進行排秩。

CFS的核心是採用啟發的方式評估特徵子集的價值

啟發方式基於的假設：

好的特徵子集包含與類高度相關的特徵，但特徵之間彼此不相關。

CFS Merits:

$Merit_{S}=frac{kar{r_{cf}}}{sqrt{k+k(k-1)ar{r_{ff}}}}$

其中，是特徵子集，包含個特徵， $ar{r_{cf}}$ 是平均的特徵和類之間的相關性， $ar{r_{ff}}$ 是平均的特徵和特徵之間的相關性。

CFS採用對稱不確定性SU計算上式中的相關性

$SU=2.0*[ frac{H(X)+H(Y)-H(X,Y)}{H(X)+H(Y)}]$

CFS首先從訓練集中計算特徵-類和特徵-特徵相關矩陣，然後用最佳優先搜索（best first search）搜索特徵子集空間。也可使用其他的搜索方法，包括前向選擇(forward selection)，後向消除(backward elimination)。前向選擇剛開始沒有特徵，然後貪心地增加一個特徵直到沒有合適的特徵加入。後向消除開始有全部特徵，然後每一次貪心地去除一個特徵直到估計值不再降低。最佳優先搜索和前兩種搜索方法差不多。可以開始於空集或全集，以空集S為例，開始時沒有特徵選擇，併產生了所有可能的單個特徵；計算特徵的估計值（由merit值表示），並選擇merit值最大的一個特徵進入S，然後選擇第二個擁有最大的merit值的特徵進入S，如果這兩個特徵的merit值小於原來的merit值，則去除這個第二個最大的merit值的特徵，然後在進行下一個，這樣依次遞進，找出使merit最大的特徵組合。

它的時間複雜度為 $m*frac{n(n-1)}{2}$ ， m是子集中特徵個數，n是全部特徵個數

流程圖：

特徵選擇之-CFS（Correlation-based Feature Selection）

熱門新聞

週熱門

特徵選擇之-CFS（Correlation-based Feature Selection）

你聽過哪些信息量很大的話？

喜歡的男孩子用信息熵來解釋他話少該怎麼辦?

以人類現有的技術是否可以做到在地球上把信息保存30億年以上？

寫作概念詞典（20）互信息，信道：學瞭如何加以使用

交叉熵損失的來源、說明、求導與pytorch實現

資訊理論（2）——熵的唯一性定理

資訊理論（一）——信息量，信息熵，交叉熵，KL散度

學習觀10四格版：什麼是信息（定性）

用XGBoost，Adaboost等以決策樹為基礎的演算法進行建模時需要特徵選擇嗎?

LightGBM/XGBoost需要進行特徵選擇嗎？

機器學習，特徵值A的取值大部分是a，極少數是b，應該怎麼處理？

特徵選擇總結之 過濾式特徵選擇（附代碼）

特徵選擇總結之 嵌入式特徵選擇（附代碼）part 1

異常檢測的特徵選擇方法

特徵選擇總結之 過濾式特徵選擇（附代碼）——單變數過濾式特徵選擇方法總結

熱門新聞

週熱門

特徵選擇總結之過濾式特徵選擇（附代碼）

特徵選擇總結之嵌入式特徵選擇（附代碼）part 1

特徵選擇總結之過濾式特徵選擇（附代碼）——單變數過濾式特徵選擇方法總結