1 seq2seq模型在機器翻譯中的應用
Sequence-to-sequence(Seq2Seq)是一個相對新的範式,最早被用在英語法語的翻譯系統中。在更高層次來看,Sequence-to-sequence模型由兩個循環神經網路組成的端到端系統。encoder將輸入序列編碼成固定尺寸的上下文向量,decoder使用上下文向量作為「種子」產生輸出序列。因此,Seq2Seq也被稱為「編碼-解碼模型」。
編碼器使用多層的LSTM將輸入的句子逆向操作並轉換為固定大小的上下文向量,逆向的原因在「常見的神經網路模型在自然語言處理中的應用」一文已經提到。下面是編碼器的模型結構: