台湾 || 语言: 大陆简体港澳繁體台灣正體

泛化誤差(generalisation error)，偏差(bias)，方差(variance)

雪花臺灣 2019-03-15 02:22

什麼是泛化誤差？它和訓練誤差的區別？

首先評判一個machine是否good的方法是其泛化能力，泛化能力可以由泛化誤差來體現。

那麼泛化誤差是什麼？

我們已經很熟悉的訓練誤差，其公式是 $E_T(w) = sum_{i=1}^n(hat{f}(x_i|w)-y_i)^2= sum_{xin D}(hat{f}(x|w)-f(x))^2$ ，其中是預測值，則是目標值，而 $D = {(x_i,y_i = f(x_i))}_{i=1}^N$ 集合D是表示一個全集的一個樣本量為N的子集。

泛化誤差的公式 $E_G(w) = sum_{xinchi}p(x)(hat{f}(x|w)-f(x))^2$ ，表示的是在全集中x出現的概率（此處的x可以是一個數據點也可以是一個數據點集合）。

是不是可以觀察到他們的不同了？

訓練誤差計算了訓練集的誤差，而泛化誤差是計算全集的誤差。相比泛化誤差來說，訓練誤差可以說只是計算了一部分的誤差。舉個例子。假設我們現在需要計算某個模型。假設在整個世界中，所有的數據有150個，如下圖。

數據全集

數據全集

相關文章