An Attentive Survey of Attention Models(注意力模型綜述)

鏈接：https://arxiv.org/pdf/1904.02874.pdf（2019.4.5）

【摘要】注意力模型已經成為神經網路中的一個重要概念，已經在不同的應用領域進行了研究。本次調查對modeling attention的發展進行了結構化和全面的概述。特別是，我們提出了一種分類法，將現有的技術分為連貫的類別。我們回顧了注意力被納入的不同的神經結構，並展示了注意力如何提高神經模型的可解釋性。最後，我們討論了modeling attention在其中具有重要影響的一些應用。我們希望這個調查將提供一個簡潔的注意模型介紹，並指導從業者在開發他們的應用方法。

1、【介紹】注意模型（AM）概念首先由機器翻譯引入，目前已成為神經網路文獻中的一個主要概念。在自然語言處理、統計學習、語音和計算機視覺等領域有著廣泛的應用。注意力背後的直覺可以用人類的生物系統來最好地解釋。例如，我們的視覺處理系統傾向於有選擇地聚焦於圖像的某些部分，而忽略其他不相關的信息，這種方式有助於感知。同樣，在涉及語言、語言或視覺的幾個問題中，輸入的某些部分可能比其他部分更相關。例如，在翻譯和總結任務中，只有輸入序列中的某些單詞可能與預測下一個單詞相關。同樣，在圖像描述問題中，輸入圖像的某些區域可能與在標題中生成下一個單詞更相關。AM(Attention Model)通過允許模型只動態地關注有助於有效執行手頭任務的輸入的某些部分，從而整合了相關性的概念。圖1顯示了使用AM對Yelp評論進行情緒分類的示例。