<EYD與機器學習>：對抗攻擊基礎知識（二十九）

各位知乎兒好，這是<EYD與機器學習>專欄對抗樣本方向的第二十九篇文章，這次我給大家介紹一篇新的防禦方向的文章。對於這個比較新的方向，我們每次都儘可能地將我們的理解努力分享給大家，如果其中有錯誤和誤解，非常歡迎大家指正，畢竟個人的能力是有限的，我們的初衷是希望通過分享能夠給大家帶來方便，也希望能在學習與交流中提升我們自身，希望大家不吝賜教。

1. AuxBlocks: Defense Adversarial Example via Auxiliary Blocks

本文[1]主要提出了一種抵禦對抗樣本攻擊的新的防禦機制。主要思想是作者基於附加信息引入輔助塊模型(Auxiliary Blocks, 簡寫為AuxBlocks)產生額外的輸出作為一種自集成演算法的防禦方法，並且分析研究了輔助塊模型的魯棒性機理。實踐表明，在防禦兩種白盒攻擊時，即使是對於完全的白盒攻擊（攻擊者可以利用防禦模型任意設計對抗樣本），都表現出良好的性能。此外，該方法的另一個優點是能夠保持分類模型對乾淨圖像的預測精度，在實際應用中顯示出較高的潛力。

作者提出輔助塊方法的思想其實非常簡單，對抗樣本是被構造來誤導模型的預測輸出的，那麼作者就認為要解決這個問題，那就輸出多個結果而不是一個。本文就是遵循這一思想，引入了輔助塊模型。在本文的防禦模型中，利用新的輔助塊擴展原來的模型，作者提出引入類似於自集成模型的多個輔助塊，並提出了適用的輔助塊結構，自集成的輔助塊模型如下圖所示，關鍵思想是在一些卷積層中添加輔助塊。結果表明，輔助塊結構的引入顯著提高了網路模型防禦白盒攻擊的魯棒性。此外，作者還考慮了完全的白盒攻擊(稱為自適應白盒攻擊)，這種攻擊是指攻擊者完全了解模型及其防禦機制，很多能夠防禦白盒攻擊的方法難以抵禦自適應攻擊。事實表明，對於自適應白盒攻擊，本文提出的輔助塊模型依然具有防禦能力。