AI 科技評論按:近年來,卷積神經網絡在人臉檢測中取得了很大的成功,然而這些方法在處理人臉中多變的尺度,姿態,遮擋,表情,光照等問題時依然比較困難。爲此,騰訊優圖推出名爲 DSFD (中文名爲雙分支人臉檢測器)的全新算法,該算法在著名人臉檢測數據集上取得喜人結果,如今騰訊優圖決定將之進行開源。

騰訊優圖的研究員們發現,雖然之前的人臉檢測算法大都採用深度學習模型,並在特徵學習的過程中也有采用特徵金字塔網絡(Feature Pyramid Network),但在面對遮擋、暗光、大姿態、小臉等複雜場景時,仍容易出現誤檢或漏檢的情況。因此,在 FPN 基礎上,騰訊優圖團隊採用了 3 種不同級聯方式的空洞卷積(Dilated Convolution),設計了特徵增強模塊 FEM,充分學習到了不同感受野下的人臉特徵。

本文提出了一種新的方法,分別處理了人臉檢測方向的三個關鍵點,包括更好的特徵學習,漸進式的損失函數設計以及基於錨點分配的數據擴充:

(1)新的「特徵增強」模塊(FEM:Feature Enhance Module)

FEM 在採用 Top-Down 層間信息融合的同時,在同一「感受野」內做了更多的 enhancement。因此在 width and depth 上學習到了更有效的 context 和 semantic 信息。

(2)「分層錨點漸進」式的代價函數監督(PLA:Progressive Anchor Loss)

模型採用 2 個層級(hierarchy),基於第一層(low-level)和第二層(high-level)的差異性,適配了不同尺寸的 anchor。在訓練過程中,PAL 對整個模型形成了更有效的監督。

(3)「改進的錨點匹配策略」(Improved Anchor Matching Strategy)

One-stage detector 由於在輸出層分配有密集的 anchor,anchor 與 face 匹配的好壞直接影響訓練效果。優圖的研究人員 data augmentation 過程中充分考慮了不同大小的 face 和各個 anchor 的關係,提出了一種新的數據擴增法。

DSFD 算法

該算法已被計算機視覺頂級會議CVPR 2019接收,原文《DSFD: Dual Shot Face Detector》(https://arxiv.org/abs/1810.10220v2)由南京理工大學計算機科學與工程學院 PCALab 與騰訊優圖實驗室合作完成。

在兩個著名的人臉檢測數據集 WIDER FACE 和 FDDB 的 5 個評測維度上,DSFD 算法均刷新了當時的世界紀錄,取得了 Top1 的人臉檢測結果:

WIDER FACE 評測結果

FDDB 評測結果

爲了與更多同行探討 DSFD 算法的實際應用,騰訊優圖在近日公佈了開源地址:

Github開源地址:https://github.com/TencentYoutuResearch/FaceDetection-DSFD

據瞭解,目前騰訊優圖的人臉檢測技術已在安防、金融、社交、交通等多個應用場景落地,並在手機 QQ、微衆銀行、天天 P 圖等多個公司內外部產品上進行應用驗證。

點擊閱讀原文,查看 CVPR 小組,瞭解 CVPR 2019 的最新動態

聲明:該文觀點僅代表作者本人,搜狐號系信息發佈平臺,搜狐僅提供信息存儲空間服務。
相关文章