台湾 || 语言: 大陆简体港澳繁體台灣正體

seq2seq模型中的Attention機制

雪花臺灣 2019-07-17 00:50

seq2seq模型的最核心的就是encoder網路得到的隱含向量。在句子較短的時候，seq2seq模型可以表現的很好，但是在長句子的場景時，隱含向量中經常會丟失了句子開始部分的信息，造成翻譯的結果不好。attention機制就是為瞭解決這個問題而提出的，核心的解決方案就是將隱含向量變成一系列隱含向量，從而保存更完整的信息。

相關文章