關於圖像分類識別的一些思考

在計算機視覺領域，圖像的分類識別，可以說是最基礎，最常見的一個問題，從之前的手動特徵提取結合傳統的分類模型，到如今的深度學習，雖然分類識別領域的各個資料庫的識別率在不斷被刷新，從常見物體識別，到細粒度物體識別，到人臉識別，似乎各個細分的圖像識別領域都在取得不斷進步，每次伴隨著這些進步，就會有意無意地激起人們對 AI 的遐想和恐慌。

不得不說，CV 發展了這麼多年，確實在不斷地進步，不過冷靜下來細想，除了各個資料庫的指標被不斷刷新，似乎最本質的問題，依然沒有解決，CNN 在 ImageNet 上的成功，雖然讓很多人看到了 AI 在圖像分類識別領域的突破，但是，最後還是遇到了瓶頸，當下的分類識別研究，比起十幾二十年前，確實有了長足的進步，可是，困難依然重重。

影響圖像分類識別的因素有很多，最常見的就是光照，形變，尺度；還有就是遮擋，模糊等，這都是一般的因素。如下圖所示：