手把手教你區分參數和超參數

歡迎關注公眾號「貪心科技」獲得更多的有關AI的乾貨內容及活動信息

相信所有人剛開始應用機器學習時，都會被兩個術語混淆。

計算機學科里有太多的術語，而且許多術語的使用並不一致。哪怕是相同的術語，不同學科的人理解一定有所不同。

比如說：「模型參數（model parameter）」和「模型超參數（model Hyperparameter）」。

對於初學者來說，這些沒有明確定義的術語肯定很令人困惑。尤其是對於些來自統計學或經濟學領域的人。

我們來仔細研究一下這些條款。

什麼是模型參數？

模型參數是模型內部的配置變數，其值可以根據數據進行估計。

參數是機器學習演算法的關鍵。它們通常由過去的訓練數據中總結得出。

在經典的機器學習文獻中，我們可以將模型看作假設，將參數視為對特定數據集的量身打造的假設。

最優化演算法是估計模型參數的有效工具。

統計：在統計學中，您可以假設一個變數的分布，如高斯分布。高斯分布的兩個參數是平均值（μ）和標準偏差（西格瑪）。這適用於機器學習，其中這些參數可以從數據中估算出來並用作預測模型的一部分。
編程：在編程中，您可以將參數傳遞給函數。在這種情況下，參數是一個函數參數，它可能具有一個值範圍之一。在機器學習中，您使用的特定模型是函數，需要參數才能對新數據進行預測。

模型是否具有固定或可變數量的參數決定了它是否可以被稱為「參數」或「非參數」。

模型參數的一些示例包括：