今天我們就正式開始模型設計,我把模型設計為一個類,即MySeq2Seq類,初始化為各種可能參數,然後我把encoder和decoder作為該類的兩個函數。
在正式設計之前我們先討論一下encoder-decoder模型(後面會繼續討論)。宏觀的敘述已經有很多了,但是具體的細節的討論似乎不是很多,這裡我們以經典RNN結構為例,主要關注encoder-decoder模型的細節。
假如我們有一句話,這裡我們將其表示為用數字表示的序列(文本經過字典映射),如[1, 2, 3, 4, 5]我們都知道RNN會對每個數字進行處理,生成一個對應的字元,balabala。而今天我們關注這個處理的細節。
想知道處理的細節就要關注RNN內部