PRML里有一节讲了回归问题的损失函数,用到了泛函和变分法,但是推导过于简略,这里补充一下详细过程。

首先平均损失为:

E[L] = intint L(t, y(x))p(x,t)dxdt

如果损失函数用均方误差,则为:

E[L] = int int (y(x) - t)^2p(x,t)dxdt

F(x,y,y^{}) = int(y(x)-t)^2p(x,t)dt

则根据变分法有当 E[L] 取极值时,满足条件 deltaint F(x,y,y^{})dx=0

然后做如下推导:

deltaint F(x,y,y^{})dx = int frac{partial F}{partial y} delta y dx+ int frac{partial F}{partial y^{}} delta y^{} dx = 0

由于 F 里实际没有 y^{} 这一项,故上式第二项为0,而:frac{partial F}{partial y} = frac{partial int (y(x) - t)^2 p(x,t)dt}{partial y} = 2int (y(x) - t) p(x,t)dt

代入上式得:

2int(int(y(x) - t) p(x,t) dt)delta y dx= 0 ,因为 delta y =alpha eta(x) 为任意可微函数,故有:

int(y(x)-t)p(x,t)dt = 0 ,做积分得: yint p(x,t)dt = int t p(x,t)dt

int p(x,t)dt = p(x) 代入得: y(x) = frac{int tp(x,t)dt}{p(x)} = int tfrac{p(x,t)}{p(x)}dt = int tp(t|x)dt = E(t|x)

所以可以看到t的均值即为最优解。

推荐阅读:

相关文章