何愷明團隊新作ResNext-101：Instagram圖片預訓練，挑戰ImageNet新精度

【新智元導讀】近日，何愷明團隊所在的Facebook AI推出ResNeXt-101模型，利用Instagram上的用戶標記圖片作為預訓練數據集，省去了人工標記數據的巨額成本，而且使用中只需微調，性能即超越了ImageNet任務的SOTA水平。

目前，幾乎所有最先進的視覺感知演算法都依賴於相同的範式：（1）在手動注釋的大型圖像分類數據集上預訓練卷積

網路，（2）在較小的特定任務的數據集上微調網路。這個模式已經廣泛使用了好多年，並取得了明顯的進展。比如：物體檢測，語義分割，人體姿勢估計，視頻識別，單眼深度估計等。

事實上，如果沒有有監督式預訓練，很多方法現在還被認為是一種蠻幹 ImageNet數據集實際上是預訓練數據集。我們現在實際上對數據集的預訓練了解相對較少。其原因很多：比如現存的預訓練數據集數量很少，構建新數據集是勞動密集型的工作，需要大量的計算資源來進行實驗。然而，鑒於預訓練過程在機器學習相關領域的核心作用，擴大我們在這一領域的科學知識是非常重要的。