PCA失敗在哪了呢?像上面描述的那樣,PCA通過在數據中找到最大方差的方向來進行操作。那麼如果投射到那個方向上沒有效果呢?下圖是由200個樣本的模擬數據組成的,這些數據形成了兩個分離的集群,它們沿著Y軸的方差大於沿著X軸的方差。如果我們對這個二維數據進行PCA操作,那麼會得到投影向量v,它將是2×1的列向量([0;1])。投射到這個向量上的原始數據X(200x2)給出了我們的得分T=Xv。在把這些得分可視化之後表明了兩個集群之間沒有明顯的分離。相反,如果我們投射到x軸上(v=[1;0]),那麼很容易地就會看到這兩個集群中的分離狀態。那麼我們如何在高維的數據中找到這個向量呢?