台湾 || 语言: 大陆简体港澳繁體台灣正體

一篇來自NLP小白的Seq2Seq的介紹

雪花臺灣 2019-07-01 22:18

作為一個NLP的小白，因為課題的緣故第一次接觸到了Seq2Seq模型。知乎上關於Seq2Seq模型有許多介紹，不過感覺對於0基礎的童鞋不是特別友好，所以本人作為小白的視角來寫一點自己對於Seq2Seq模型的理解，希望能幫助到各位剛入門的盆友。同時作為Rookie，有些地方可能理解的不是很到位，大家如有發現歡迎及時批評指正。

1. 循環神經網路（RNN）

要想理解Seq2Seq模型，首先要知道NLP的基本模型單元——RNN究竟是什麼。RNN的設計思路是模仿我們人類的閱讀行為，通過獲取相鄰的幾個詞或短語（文本輸入）來判斷這句話到底是想表達什麼，因此它採用如下的鏈式結構。我們期待的RNN的功能是借用深度學習的思想，來提取文本序列中的語義（semantic）和句法（syntactic）信息。

單層RNN網路

h_t =f(h_{t-1},x_t) — 單層RNN網路

相關文章