為什麼DL,RL裡面演算法的最初版本都叫vanilla?
比如:
RNN的最簡單最初版本叫Vanilla RNN。
Policy Gradient 演算法也有被叫 Vanilla PG.
用最原始的DDPG演算法也常被叫Vanilla DDPG.
vanilla的中文是香草。在老美那邊,貌似香草味就是咱們的原味。所以原味差不多就是原始版本的意思吧。
謝邀。
Vanilla這個單詞在深度學習里挺常見的,例如vanilla convolution,vanilla neural network。
Vanilla原義香草,香草味就是老美的原味,所以vanilla這個單詞引申含義就有「普通的、原始的」的意思。
近義詞:general、raw。
這個回答比較準確。主要是源自香草冰淇淋。
為何 Vanilla(香子蘭)有「原版」的含義??www.zhihu.com大家說的都很對,這裡我用一張圖來另作補充(來自CS224n slides):
就跟naive是一樣的
起初四處看論文時被這個詞給迷暈了,以為Vanilla PG與平時說的PG演算法不同。看得多了才知道原來Vanilla就是標準演算法的意思。
這個詞最初用於美國商界俚語,指的就是基本的交易,標準的交易。所以在別處看到Vanilla基本上都是基礎版本的意思,在機器學習中也是一樣。
樸素貝葉斯,香草策略梯度,標準DQN…都是演算法最基礎版本的意思。
Vanilla,意思為香草,香草就是原味的意思。
Vanilla PG,意味最初版本的策略迭代演算法
推薦閱讀: