AdaptiveFace 閱讀筆記

這是CVPR 2019 一篇人臉識別的文章。三個創新點：

1. 針對類別不均衡問題，改進 margin-based softmax loss，不再對每一類設置固定大小的margin，而是自適應的學習margin，使得訓練樣本少且類內方差小的類有更大的margin。

2. 由於人臉數據集中的類別數非常大（包含的人數非常多），但對於每一個人而言，和他長得比較像的、容易分錯的人就那麼幾個。為了高效的進行訓練，提出了一種Hard Prototye Mining，使得訓練時只關注相近的類別。

3. 同樣是出於訓練效率的角度，提出了改進版的難例挖掘——Adaptive Data Sampling。其對每一個訓練樣本都分配一個權重，如果某樣本被分類正確，則減小其權重，使其之後被選到的概率減小，而對於分錯的樣本則增加其權重。這樣在訓練後期，總被分對的樣本就不會再參與訓練，網路會專註於學習難分樣本。

這幾個點看起來好像不是很大，但其實已經很不容易了，主要還是識別任務確實已經非常成熟了，CVPR今年識別相關工作比例之低也說明瞭這一點。

關於創新點1：

之前的margin-based softmax loss 確實可以減小類內方差，擴大類間方差，如圖1，但是卻沒有考慮到樣本不均衡問題。對於訓練樣本量較少、且訓練樣本的類內方差不是很大的類別，這種loss 對類內方差 squeeze 得不夠小，如圖2 (a) 所示。圖2 中，紅色是樣本數量充足的類，藍色是樣本數較少的類。由圖2(a) 可見，紅色類的大量樣本和藍色類的少量樣本都被壓縮在大小相同的特徵空間，然而實際上，由於藍色類別樣本量少，而且現有樣本的類內方差小，因而其潛在的實際特徵空間是更大的，實際的類內方差也更大，類間方差也相對減小了，如圖中淺藍色區域所示，這就有點違背了最初壓縮類內方差、擴大類間方差的初衷。而作者提出的AdaM Softmax 如圖2(b) 所示，藍色類的少量樣本被壓縮的更緊了，這就可以使得藍色類潛在的實際特徵空間也是被有效壓縮的。