一、什麼是超參數
機器學習一般有兩類參數,一類是參數,通過數據訓練,可逐步優化與完善,另一類是超參數,通常是人類通過以往經驗設置的值,沒法通過普通訓練完善,比如,學習率和強化學習裏計算reward的參數等。
二、當前主流的超參數優化演算法
a.暴力型
網格搜索,顧名思義,每個超參數用規則得到幾個枚舉點,然後交叉組合得到一堆解,挨個枚舉選出結果最好的超參數。
隨機搜索,顧名思義,就是隨機生成一堆解,然後挨個嘗試,選出結果最好的作為最優解。
b.擬合型
a中方法很暴力,在大多數情況下也是比較實用的,但該類方法多次嘗試之間是獨立的,因而往往需要大量嘗試才能獲得非常優的解。
有研究者針對此進行優化,使用模型來擬合這個問題,把超參數作為輸入,訓練模型的能力作為輸出,其他作為黑盒,即"模型能力=f(超參數)",通過合適的模型來擬合這個f。這類方法通常如下圖的步驟所示: