ACL2017《A Local Detection Approach for Named Entity Recognition and Mention Detection》Summary

論文地址：《A Local Detection Approach for Named Entity Recognition and Mention Detection》。

Gayhub地址：xmb-cipher/fofe-ner

摘要

通常大家會把命名實體識別當做序列標註問題去解決，本文提出一種局部探測的方法，通過固定長度的句子片段及其前後文來對命名實體進行識別。在CoNLL 2003 NER、TAC-KBP2015和TAC-KBP2016任務上表現很好。

序列標註問題是把整個句子進行訓練與測試，進而識別出句子中的實體。而局部探測方法的對象是句子中的每個片段，達成精準的局部探測的要點是把句子片段以及其充足的上下文信息識別出來。

許多特徵工程技術都難免會造成上下文信息的丟失，這裡選擇了一種定長編碼技術：fixed-size ordinally forgetting encoding(FOFE)。

整個模型的基本流程是這樣的：

前饋神經網路就是最常見的多層感知機，基於單詞和基於字母的模型根據字面意思也都容易理解，這裡簡要講下FOFE。

NLP中文本都是變長的，RNNs/LSTMs模型擅長處理這類數據，而FFNN並不擅長。但是，FOFE可以把變長數據編碼為定長數據，這就很好克服了FFNN自身的限制，畢竟FFNN這種簡單模型的訓練和預測效率非常高。

FOFE的編碼思想類似於詞帶模型(BoW)+遺忘因子：

2. 設定一個遺忘因子，使用以下公式計算出每個單詞的最終編碼：

3. 例如對於序列，其結果為；對於序列，其結果為。這就把任意變長序列編碼為長度為的定長編碼。

FOFE-NER最主要的特徵如上圖，每個序列被拆分為三部分(left+segment+right)，這三部分先經過FOFE演算法進行一輪編碼，然後進入FFNN中進行NER。

此外，還可以引入其他基於單詞的特徵和基於字母的特徵，文章中講的比較清楚。

在訓練過程中，實體主要有以下情況：

對於上述情況，在分類上採取這樣的措施：

對於預測結果，如果存在冗餘結果，可以根據以下策略進行剔除：

通過借鑒CRF的思想，我們構造兩輪FOFE-NER模型，在第一輪中目標是把

Google has also recruited Fei-Fei Li, director of the AI lab at Stanford University

預測為

<ORG> has also recruited Fei-Fei Li, director of the AI lab at <ORG>.

用實體類型替代實體後，進一步尋找實體Fei-Fei Li

我們用CoNLL2003 NER數據集測試結果來理解特徵選取和模型對比：

NER問題目前比較常規的解決方法是圍繞LSTM和CRF展開的，相比於直接把整個序列作為輸入的序列標註模型，本論文提出的局部探測法更加強調了局部上下文信息在NER問題中的重要性。而且，本論文提出的模型結構簡單，性能上應該更優（待進一步驗證）。