上一节介绍了自回归过程 AR(p) ,本节介绍移动平均过程 MA(q) 以及两者的结合 ARMA(p,q) 。然后推导脉冲响应函数。

一、移动平均过程

字面意思,移动平均过程(Moving Average Process, MA)指的是白杂讯的移动平均,白杂讯定义见第0节。根据白杂讯滞后的阶数分为一阶和高阶。一阶的移动平均过程 MA(1) 具有以下形式:

y_{t}=mu+epsilon_{t}+	heta_{1}epsilon_{t-1}

其中, left{epsilon_{t}
ight} 为白杂讯: Eepsilon_{t}=0 , Cov(epsilon_{t}, epsilon_{s})=0,t≠s	heta_{1} 为待估计参数。常数 muleft{ y_{t}
ight}的均值。因为对等式两边求期望 E(y_{t})=Emu+Eepsilon_{t}+	heta Eepsilon_{t-1}=mu

高阶( q 阶)的移动平均过程 MA(q) 形式如下:

y_{t}=mu+epsilon_{t}+	heta_{1}epsilon_{t-1}+cdotcdotcdot+	heta_{q}epsilon_{t-q}

其中, left{epsilon_{t}
ight} 为白杂讯: Eepsilon_{t}=0 , Cov(epsilon_{t}, epsilon_{s})=0,t≠s	heta_{1},	heta_{2},cdotcdotcdot,  	heta_{q} 为待估计参数 。muleft{ y_{t}
ight}的均值。

形式上看, 可以视为 y_{t} 自身均值与有限个白杂讯的线性组合。或者理解为围绕自身均值进行白杂讯形式的微小的波动。我们有 y_{t} 的时间序列数据,如何估计参数 	hetaOLS 不可行因为我们没有 epsilon_{t} 的数据。 left{epsilon_{t}
ight} 为独立同分布的正态分布, MLE 是可行的。

二、自回归移动平均过程

自回归移动平均过程( ARMA )由 AR 和删去常数项的 MA 两块组成,因为 AR 中已经有常数项 eta_{0} ,形式如下:

y_{t}=eta_{0}+eta_{1}y_{t-1}+cdotcdotcdot+eta_{p}y_{t-q}+epsilon_{t}+	heta_{1}epsilon_{t-1}+cdotcdotcdot+	heta_{q}epsilon_{t-q}

如果让 q
ightarrow∞,就得到MA(∞)y_{t}=mu+epsilon_{t}+	heta_{1}epsilon_{t-1}+cdotcdotcdot=mu+sum_{j=0}^{∞}	heta_{j}{epsilon_{t-j}}

其中, 	heta_{0}=1MA(∞) 的意义是把 y_{t} 的决定因素追溯到无穷远的过去,每期有一个冲击 epsilon_{t} ,累加起来得到 y_{t}MA(∞)要有意义,需要无穷级数 sum_{j=0}^{∞}	heta_{j}{epsilon_{t-j}} 收敛。收敛的一个充分条件是系数绝对值可加总,即 sum_{j=0}^{∞}|	heta_{j}|<∞ 。实践中样本容量有限,不能追溯到无穷远。但 MA(∞) 仍有重要的理论意义,因为 AR(p)ARMA(p,q) 都可以写为 MA(∞) 的形式!证明见下。

三、脉冲响应函数

首先把 AR(1) 改写为 MA(∞):

y_{t}=eta_{0}+eta_{1}y_{t-1}+epsilon_{t}\        =eta_{0}+eta_{1}(eta_{0}+eta_{1}y_{t-2}+epsilon_{t})+epsilon_{t}\ =cdotcdotcdot\=eta_{0}(1+eta_{1}+eta_{1}^{2}+cdotcdotcdot)+epsilon_{t}+eta_{1}epsilon_{t-1}+eta_{1}^{2}epsilon_{t-2}+cdotcdotcdot\=frac{eta_{0}}{1-eta_{1}}+epsilon_{t}+eta_{1}epsilon_{t-1}+eta_{1}^{2}epsilon_{t-2}+cdotcdotcdot

第一个等号是 AR(1) 的定义,第二个等号是 y_{t-1} 表达式的迭代,第三个等号省略的是 y_{t-2}y_{t-3} ,...不断迭代。第四个等号是无穷等比数列求和。把最后一行对比 MA(∞) 表达式,发现 frac{eta_{0}}{1-eta_{1}} 相当于原来的mueta_{1}^{j} 相当于原来的 	heta_{j} ,所以平稳的AR(1)MA(∞) 是等价的!

为什么这么写?

因为改写之后, AR(1) 可以视为过去所有扰动项效应之和,并且扰动项,或者叫冲击,对 y_t 的影响力呈几何级数递减,即 frac{partial y_{t}}{partialepsilon_{t-j}}=eta_{1}^{j} 。表达式的含义:第 t-j 期的冲击epsilon_{t-j} 变化一个单位对 y_t 的影响为 eta_{1}^{j} 。注意到 frac{partial y_{t}}{partialepsilon_{t-j}} 与绝对时间 t 无关,只是相对时间间隔 j 的函数。所以 IRF=frac{partial y_{t}}{partialepsilon_{t-j}}=eta_{1}^{j} 被称为脉冲响应函数(Impulse Response Function,IRF)。字面意思就是刻画 y_tepsilon_{t-j} 一单位脉冲的响应。画在平面上就被称为脉冲响应图。类似地,采取不断迭代的方法,可以把 AR(p)ARMA(p,q) 写成 MA(∞) 的形式,定义脉冲响应函数。如何直观理解脉冲响应函数?具体例子见下一节。

小结:前3节从理论上讲了 ARMA 模型。实践中,拿到数据之后,识别阶数,模型估计和预测的具体步骤如何操作?脉冲响应图怎么画?下一节会以 GDP 的时间序列数据为例来展示。


推荐阅读:
相关文章