台湾 || 语言: 大陆简体港澳繁體台灣正體

論文筆記——Semantic Sentence Matching with DRCN

雪花臺灣 2019-06-09 18:44

Introduction

本文出自韓國 Naver Corporation 和 Seoul National University ，工作定義在句子匹配任務上。Sentence Matching的關鍵之處在於如何表示句子語義（目前感覺就是上下文信息和類似 POS 的特徵信息，不能說是語義），如何理解句子之間的語義關係。查看相關工作可以得到，Attention 演算法在刻畫兩個句子語義關係和對齊句子成分方面有很好的效果，但是也有不足之處。Attention 機制僅使用求和操作，這樣來自於上層的特徵信息就會被破壞，不能完整保留下來。作者借鑒了圖像識別中的DenseNet的密集連接操作，旨在更好地利用原始特徵信息。

本文提出Densely-connected co-attentive RNN，密集連接stack RNN，這樣從最底層到最頂層一直保留原始信息，在stack RNN的每一個block中，用co-attention的方式得到兩個句子之間的交互信息，能量函數用的最簡單的算cos距離。因為stack RNN會參數量會迅速增加，影響模型訓練，因此用自編碼器進行壓縮表示。

模型目前在SNLI的排名第一，集成之後，在測試集上破了90%正確率的大關。過去應該也沒有人認為句子匹配任務需要把網路做深，當然現在也是，效果沒提升多少，我感覺這只是個嘗試，企業就喜歡這種簡單粗暴不考慮計算力的模型。

Model

The Whole Model

The Whole Model

相關文章