台湾 || 语言: 大陆简体港澳繁體台灣正體

命名实体识别领域文献调研

雪花台湾 2019-03-22 03:20

处理NER任务的神经网路结构

百度的Zhiheng Huang[1]于2015年首度提出了Bi-LSTM-CRF架构用于自然语言处理序列标注任务。文中对比了LSTM、Bi-LSTM、CRF、LSTM-CRF与Bi-LSTM-CRF这几种模型的表现。文中选择了以下3种特征作为神经网路的输入：spelling features、context features、word embedding，同时在特征连接时也使用了一种技巧，如下图所示，将spelling features、context features作为输入的同时又直接连接到输出端用于预测tag。最终该论文将模型应用于POS、chunking和NER这3种序列标注任务中获得了最先进的水平。

相关文章