作為一個NLP的小白,因為課題的緣故第一次接觸到了Seq2Seq模型。知乎上關於Seq2Seq模型有許多介紹,不過感覺對於0基礎的童鞋不是特別友好,所以本人作為小白的視角來寫一點自己對於Seq2Seq模型的理解,希望能幫助到各位剛入門的盆友。同時作為Rookie,有些地方可能理解的不是很到位,大家如有發現歡迎及時批評指正。
1. 循環神經網路(RNN)
要想理解Seq2Seq模型,首先要知道NLP的基本模型單元——RNN究竟是什麼。RNN的設計思路是模仿我們人類的閱讀行為,通過獲取相鄰的幾個詞或短語(文本輸入)來判斷這句話到底是想表達什麼,因此它採用如下的鏈式結構。我們期待的RNN的功能是借用深度學習的思想,來提取文本序列中的語義(semantic)和句法(syntactic)信息。