寫在前面:本篇文章集中介紹了前饋神經網路模型、卷積神經網路模型、遞歸神經網路模型在自然語言處理領域的應用。對於模型本身,在《深度學習綜述》一文中,已經有了一個比較細緻和全面的介紹,這裡將不做過多的介紹。
這裡要介紹的任務是一個分類問題,也可以認為是一個序列標註問題。自然語言處理中有一個很重要的基本問題,就是分詞和詞性標註問題。在處理分詞問題,一個常見的處理方法是將單詞標註為BIO類型。 BIO標註是將每個元素標註為「B-X」、「I-X」或者「O」。其中,「B-X」表示此元素所在的片段屬於X類型並且此元素在此片段的開頭,「I-X」表示此元素所在的片段屬於X類型並且此元素在此片段的中間位置,「O」表示不屬於任何類型。