写在前面:本篇文章集中介绍了前馈神经网路模型、卷积神经网路模型、递归神经网路模型在自然语言处理领域的应用。对于模型本身,在《深度学习综述》一文中,已经有了一个比较细致和全面的介绍,这里将不做过多的介绍。
这里要介绍的任务是一个分类问题,也可以认为是一个序列标注问题。自然语言处理中有一个很重要的基本问题,就是分词和词性标注问题。在处理分词问题,一个常见的处理方法是将单词标注为BIO类型。 BIO标注是将每个元素标注为「B-X」、「I-X」或者「O」。其中,「B-X」表示此元素所在的片段属于X类型并且此元素在此片段的开头,「I-X」表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,「O」表示不属于任何类型。