台湾 || 语言: 大陆简体港澳繁體台灣正體

綜述：注意力機制在自然語言處理中的應用

雪花臺灣 2019-03-16 16:06

摘要

近些年來，注意力（Attention）機制已經成為深度學習中的一個熱點。在自然語言處理領域中，特別是在Seq2Seq模型中，注意力機制更是成為一種「標配」，出現在各種各樣的任務裏。本文將按照時間和分類順序，對自然語言處理中出現過的注意力機制、常見變種以及評價指標等進行介紹。

目錄

簡介
基本概念
變種

Multi-dimensional Attention
Soft Attention 和 Hard Attention
Global Attention 和 Local Attention
Hierarchical Attention
Attention Over Attention
Memory-based Attention
Self-Attention

評價指標

定量指標
定性指標

結論
引用

簡介

注意力機制的思想很早就存在，第一次應用在深度學習是在計算機視覺中。我們在觀察一幅圖時，我們的注意力會自然地集中於圖像的某些地方，例如，當我們看到下圖時，我們的注意力會集中在小智、皮卡丘、噴火龍等角色上，而非圖片背景上。

精靈寶可夢示意圖

精靈寶可夢示意圖

相關文章