本课主要包含3方面的内容:1,普通RNN简介;2,普通RNN的后向传播;3,双向RNN简介及其后向传播。
一,普通RNN简介:
在许多使用场景下,输入是一个序列,输出是一个值或一个序列。比如,文本主题分析,输入一个单词序列,输出序列所属的主题;机器翻译,输入一个英文单词序列,输出一个法语单词序列等等。
1,普通RNN的简化表示:(非常重要!深入理解RNN的关键)
(1),每次的输入(蓝色)是一个向量;
(2),每一个隐含层(绿色)都有多个神经元;
(3),输出层(红色)同样有多个神经元;
(4),但,他们都将以一个单独的小方格来表示。即,每个小方格,代表拥有许多神经元的网路层(每一层默认全连接)。