台湾 || 语言: 大陆简体港澳繁體台灣正體

Seq2Seq模型與動態記憶網路在自然語言處理領域的應用

雪花台灣 2019-07-01 22:30

1 seq2seq模型在機器翻譯中的應用

Sequence-to-sequence（Seq2Seq）是一個相對新的範式，最早被用在英語法語的翻譯系統中。在更高層次來看，Sequence-to-sequence模型由兩個循環神經網路組成的端到端系統。encoder將輸入序列編碼成固定尺寸的上下文向量，decoder使用上下文向量作為「種子」產生輸出序列。因此，Seq2Seq也被稱為「編碼-解碼模型」。

編碼器使用多層的LSTM將輸入的句子逆向操作並轉換為固定大小的上下文向量，逆向的原因在「常見的神經網路模型在自然語言處理中的應用」一文已經提到。下面是編碼器的模型結構：

相关文章