人腦是怎麼防止梯度消失和梯度爆炸的?

人腦有接近900億個神經元，這麼龐大的網路規模是如何防止梯度消失和梯度爆炸的呢？我自己想的是，因為人腦不會一次性激活所有神經元，在腦區較遠的地方將結果進行緩存。（這是不是res網路發明跳連的原因呢？）想聽下更深入學習者的看法

現在大家普遍認為人腦並沒有像DNN那樣的梯度回傳機制...了解一點生物學就知道神經元的傳遞是單向的。但是至於能不能2個神經元一個前饋一個回傳？現在的研究並沒有發現...而且一般都是把這種鏈接看成循環結構的（RNN）。

其次新生的動物大概率不需要學習就能掌握很多基本的信息處理能力。例如牛羊馬這些一生下來就能走路的。說明他們基因里就預編程了走路運動，視覺等一些基本能力，而這些能力我們都是通過backpropagation訓練模型來達成的。人類之所以生下來看不清。現有的解釋大約是人類在出生時並沒有發育完全，不然嬰兒頭太大無法順利生產。

但是，大腦里肯定是存在回傳error從而修改突觸權重的機制的。這一類機制里現在最靠譜的就是predictive coding。

4月18號更新：

Hinton老爺子昨天剛在nature上發了一篇paper。裡面提出了一種不需要backpropagation的local優化方法。感興趣的可以去下面這個鏈接看一下。

https://www.nature.com/articles/s41583-020-0277-3?

www.nature.com

論文中有一段專門講了一點先驗知識的部分。和之前答案的第二段觀點基本相吻合。