什麼是泛化誤差?它和訓練誤差的區別?
首先評判一個machine是否good的方法是其泛化能力,泛化能力可以由泛化誤差來體現。
那麼泛化誤差是什麼?
我們已經很熟悉的訓練誤差, 其公式是 ,其中 是預測值, 則是目標值,而 集合D是表示一個全集 的一個樣本量為N的子集。
泛化誤差的公式 , 表示的是在全集 中x出現的概率(此處的x可以是一個數據點也可以是一個數據點集合)。
是不是可以觀察到他們的不同了?
訓練誤差計算了訓練集的誤差,而泛化誤差是計算全集的誤差。相比泛化誤差來說,訓練誤差可以說只是計算了一部分的誤差。舉個例子。假設我們現在需要計算某個模型。假設在整個世界中,所有的數據有150個,如下圖。