當前的機器學習方法,似乎都基於正確的先驗知識,那麼先驗知識是否一定正確(非僅僅指過擬合問題)?如果不是,是否有其他方法可以糾正或者得到更加正確的解答呢?


看定不一定對,但是參考意義相當大。著名的應該就是黑天鵝和白天鵝了,一開始大家默認天鵝是白的,這就是先驗知識,只要說天鵝,就是白的,但那只是因為地域局限性,其他地方也有黑天鵝,等到他們見到黑天鵝的時候,說天鵝就不一定是白的了。但是對於他們沒有見到黑天鵝那段時間,先驗知識有很多好處,最起碼說天鵝的時候可以少說一個字也能表達明白意思。

第二個問題,更多樣本,可以更好擬合,想要全部的話,只能開啟上帝視角,答案是不可能。


不一定 誤導後人的不在少數
任何基於數理統計的統計推斷而假設的概率分布都不可能是百分之百正確的,更別說先驗分布了。先驗分布更加是依靠經驗來假設的,無信息先驗分布和共軛先驗分布在一定程度上可以緩解這個問題,還有參照其他的文獻,比如我的碩士論文的先驗分布都是找的前人論文中提出來的比較科學的先驗分布。

先驗知識也有錯誤的,比如訓練數據都是人工標註的,但人也會犯錯,偶爾標註錯了一兩個不是很正常嘛。。。


不是啊,先驗分布要是都是對的了我們學啥呢,後驗分布就是根據真實數據調整先驗分布


從本體論的角度先驗知識恆為真命題


推薦閱讀:
相关文章