台湾 || 语言: 大陆简体港澳繁體台灣正體

【deeplearning.ai】深度學習(10)：序列模型

雪花台灣 2019-04-18 03:38

深度學習(11)：序列模型?

binweber.top

採用循環神經網路能夠建立各種各樣的序列模型（Sequence Model）。加入一些注意力機制，能夠使這些序列模型更加強大。

Seq2Seq模型

2014年Cho等人在論文[Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation]中首次提出了Seq2Seq（Sequence-to-Sequence）模型。從機器翻譯到語音識別，這種模型能夠在各種序列到序列的轉換問題中得到應用。

一個Seq2Seq模型中可分成編碼器（Encoder）和解碼器（Decoder）兩部分，它們通常是兩個不同的神經網路。如下圖是谷歌機器翻譯團隊的Sutskever等人2014年在論文[Sequence to Sequence Learning with Neural Networks]中提出的機器翻譯模型：

相关文章