本課主要包含3方面的內容:1,普通RNN簡介;2,普通RNN的後向傳播;3,雙向RNN簡介及其後向傳播。
一,普通RNN簡介:
在許多使用場景下,輸入是一個序列,輸出是一個值或一個序列。比如,文本主題分析,輸入一個單詞序列,輸出序列所屬的主題;機器翻譯,輸入一個英文單詞序列,輸出一個法語單詞序列等等。
1,普通RNN的簡化表示:(非常重要!深入理解RNN的關鍵)
(1),每次的輸入(藍色)是一個向量;
(2),每一個隱含層(綠色)都有多個神經元;
(3),輸出層(紅色)同樣有多個神經元;
(4),但,他們都將以一個單獨的小方格來表示。即,每個小方格,代表擁有許多神經元的網路層(每一層默認全連接)。