背景
時間序列的預測通常會面臨以下兩種情況:
- 長期的預測需要考慮趨勢信息(長期依賴),短期的預測需要考慮細粒度的波動性(短期依賴);
- 一些週期規律不太明顯的場景,依賴關係會隨著時間動態變化。
難點
如何建模長期(動態)的依賴?具體有一下兩方面的原因:
1. 現有的RNN會存在梯度消失和梯度爆炸的問題。(LSTM/GRU+一些初始化策略只能在一定程度上緩解該問題)
2. 需要同時考慮長期依賴和短期依賴,往往是 trade-off。
相關工作
目前最有效的方案是多尺度 pattern 的建模。現有工作主要可以分為兩類:
- 第一小類是通過建立不同粒度的隱層,低層的更新頻率較高,更高層的更新頻率較低。
多隱層 RNN 模型,下圖所示,第一個隱層是在單詞級別的建模,第二個隱層是在句子級別的建模。