前言

人的任何一個行為、動作,都是選擇的結果。所謂選擇,就是在多種可能性中進行比較,這個過程中「最」是一個離不開的字眼。即使在人工智慧中,對「最」進行選擇也是必須的過程。比如,阿爾法狗的圍棋程序,它下出的每一步棋都是在多個可能性中,選擇贏棋概率「最大」的一步。本文介紹的「最強選擇原理」,它對神經元的工作方式進行了重新定義,並在此基礎上形成了一種全新的神經網路。它最大的特點是:神經網路中的每一個節點由多個具有不同功能的神經元構成(而非單個神經元);信號傳遞在神經網路中的任何一個節點,都是以「最強選擇」為基礎進行的。理論上這種神經網路可以實現感知、識別、計算、推理、控制、語言處理、學習、記憶等各種信息處理功能。與傳統人工神經網路相比,它在結構上更接近大腦的生理結構,並且它是一個非黑箱模型,具有完全的可解釋性,過程上也更符合大腦的認知過程。本文作者認為它就是大腦工作的基本模型。無論這個判斷最終結果是否正確,至少它可以在現階段為研究大腦及人工智慧的工作者提供一種全新的思路。

一、 最強選擇原理及基本結構

最強選擇原理:對於任意一個對象(它可以是一個或一些物體、一種環境、一個字、一句話、一個動作、一個事件、一個規則、一個刺激等等),都可以用一個由多個神經元組成的神經單元來對應。只有這個神經單元的活躍強度最大,該神經單元所對應的對象才會被選擇,同時觸發該對象所對應的的輸出。

下圖是最強選擇原理的基本結構:

神經單元:神經單元代表某一具體對象,不同的神經單元對應不同的對象,比如神經單元1代表蘋果,神經單元2代表梨子等等。每個神經單元由多個神經元構成,它們具有不同的工作方式及意義。

A類神經元(A1、A2、A3…..An):接收來自其它神經單元的輸入(或外部輸入)信號,並將所有輸入信號的強度進行累加。它代表該神經單元所對應對象被選擇地可能性。只有A類神經元活躍強度最大的神經單元,才能得到選擇神經元的選擇。

B類神經元:當某一神經單元被選擇,且選擇神經元的B處有輸入時,該神經單元的B類神經元將被激活並形成輸出(向下)。B類神經元代表某一對象的內涵,其輸出隻影響該對象所具有的特徵神經單元,稱之為向下輸出。它在其對應對象的預測階段被激活。比如識別某一對象,在確認它之前有一個預測階段,這一階段被選擇的神經單元B類神經元活躍,會通過其連接激活相應的特徵神經單元,與外部輸入的特徵進行比對。再如:某一動動作可分解為多個局部動作,代表該動作的B類神經元發出的向下輸出與這些局部動作形成聯繫,並在執行這個動作時通過其B類神經元的輸出對這些局部動作的選擇產生影響。

當選擇神經元的B類開關信號消失時,B類神經元的活躍即刻停止。

C類神經元:當某一神經單元被選擇,且選擇神經元的C處有輸入時,該神經單元的C類神經元將被激活。C類神經元的輸出向上與高層整體對象的特徵形成聯繫,並通過高層的整體對象與其它對象形成關聯,因此C類神經元代表了該神經單元所對應對象的外延。

C類神經元在其對應對象的確認階段被激活。比如某一神經單元對應某一動作。在執行這個動作的過程中,這一動作是否能完整執行尚未可知,因此可以說這一階段是處於預測階段,該神經單元的B類神經元活躍。當該動作執行完成,其C類神經元被激活,並通過其輸出影響下一階段動作的選擇。

與B類神經元不同,當選擇神經元的C類開關信號消失時,C類神經元的活躍可以有一定時間的延遲。

選擇神經元

為便於區別,把選擇神經元用橢圓形來表示。這是一種特殊的神經元,它的工作很簡單:其輸出是一根沒有分支的神經纖維,神經纖維的末端受神經單元中A類神經元的活躍所吸引;A類神經元活躍強度越大,其對選擇神經纖維末梢的吸引力越大。因此,選擇神經元的神經纖維末端始終指向最活躍的那個A類神經元,並激活該神經單元中的B類或C類神經元。圖中的虛線箭頭是有可能形成的選擇(而不是類似軸突的分支)。

選擇神經元的輸入(箭頭處的B、C),它們起類似開關的作用,只有在有輸入的情況下,選擇神經元才激活被選擇神經單元中相關的神經元。比如,當選擇神經元的B處有輸入時,其所選擇的神經單元中的B類神經元活躍。

選擇神經元只對某一區域內的神經單元進行選擇,這一區域內的神經單元屬於同一類別的具體對象。因此選擇神經元本身含有「類」的意義。比如,前圖中的神經單元1代表蘋果,神經單元2代表梨子,神經單元3代表桃子等等,圖中的選擇神經元則具有了「水果」的含義,它只在這一代表水果的區域內對神經單元進行選擇。代表左轉、右轉、前進、後退的神經單元在另一區域,由另外的選擇神經元進行控制。

根據同樣的原理,還可以在神經單元中增加其它神經元類型,比如代表「非」、「無」的D類神經元等等。對於一個具有特定功能的神經網路模型,還需要一些其它發放模式的神經元,如抑制性神經元、能對外部刺激形成響應的感覺神經元等等。它們的發放規則在具體的神經網路模型中再另行約定。

為便於理解這個模型,並證明它具有最基本的信息處理能力,下面以最簡單的感知模型為例,看它如何實現對外部刺激強度實現「感知」。

二、最簡單的感知模型

傳統的信息處理系統首先必須將連續變化的模擬信號轉換為離散的數字信號,再進行進一步處理。感知則是大腦信息處理的第一步。它同樣也是將連續變化的外部輸入轉化為離散的「知覺」,比如有、無、痛、癢、冷、暖、熱等等,其實質是對外部輸入進行分類。無論是視覺、聽覺、觸覺、嗅覺等各類信號,其過程都是通過外部刺激作用於感覺神經末梢形成神經衝動,再傳遞到皮層經過處理後形成對應的知覺。

最簡單的感知任務,就是對單一外部刺激的強度進行分類。下圖是以最強選擇原理為基礎的神經網路模型,它可以把外部刺激根據強度的不同進行分類,形成最簡單、最初級的「知覺」。

如圖:

上圖模型運行的結果是:當刺激強度值G滿足 Y(i-1)+ M』 <G<Yi+M』 時,輸出神經元Ci活躍 ( 當i=1時,C1的激活條件是0<G<Yi+M』)

這個模型有如下特點:

1、此模型對刺激強度進行分類,是利用B類神經單元所觸發的抑制,與外部刺激形成的輸入進行比對。比對成功就形成輸出,不成功則進行下一次比對。在抑制神經元的作用下,當神經元M的活躍強度低於M』,即表示比對成功;當比對時間超過某一設定,也就是神經元P活躍強度大於神經元P』時,表示比對不成功,進入下一個比對過程。在分類結果出來以前,神經元T在選擇神經元3所控制的神經單元的作用下會按一定頻率發放,其發放周期就是完成一次比對的時間,發放周期=P』/T(變化速率)。完成一次分類任務所需時間是i* P』/T(變化速率)(i=1、2、3…..n).

2、對於所有分類結果,均是以刺激強度的範圍來確定的,而不是某一個或某一些具體值。我們以對溫度的知覺為例,將上圖神經元G看做是接收溫度刺激的感覺神經元,它的活躍強度與溫度成正比。適當調節Y1、Y2……Yn抑制強度值,可以對溫度刺激形成不同分類,比如:4度以下形成「冰冷」的感知;4度—15度形成冷的感知;15度—25度形成涼的感知 ;25度—35度形成暖的感知;35度—45度是熱,45以上是燙等等。這種以強度範圍來進行分類的特點,正是模糊處理的體現。

3、神經元M、M』等可接受其它模塊通過抑制、興奮的方式進行調節。這會導致某些情況下,即使是相同度外部刺激強度,形成的感知未必相同。比如同樣20度的水溫,有些時候我們會感覺是冷,有些時候感覺是暖。這個模型可以通過增加其它模塊調節神經元M或M』來實現這樣的現象。

4、當n值較大,也就是分類任務很多時,完成一次分類可能需要很長時間。解決辦法可以通過增加層次來縮短感知時間。比如增加一個同樣結構的模塊,先對刺激強度以更粗略的範圍來分類,並在此基礎上進行更精細的細分,如此可提高分類的效率。

此模型可以初步證明最強選擇原理是一種具有信息處理能力的特殊方法。在後面的文章中,將會有一些簡單的關於識別、並行處理、學習記憶等功能的具體模型。

三、與大腦結構的比較

大腦有很多獨特的結構特點,對此我們已經有豐富的了解。然而對於這些結構的作用及形成原因,目前還沒有一個理論能進行全面解釋。比如目前的人工神經網路,儘管已經在某些方面實現類似人腦的功能,但其結構上與人腦幾乎沒有可比之處。我對大腦結構的知識僅僅局限於一些基本知識的了解,但令我興奮的是最強選擇原理可以完美的解釋很多這些獨特結構。下面先將最強選擇原理的基本結構,與大腦皮層的一些結構特徵進行比較。

1、 最強選擇神經元是否存在?

要將這個模型與大腦進行比較,第一個問題就是選擇神經元有可能存在嗎?前面提到了選擇神經元的工作方式:它發出一根沒有分支的神經纖維(註:它不同於普通神經元的軸突),其末端投射到皮層中某一區域。該區域內的A類神經元活躍,其神經衝動形成的電磁場會對選擇神經元的神經纖維末端產生吸引。活躍強度越大吸引力越大,因此選擇神經元的神經纖維末端始終指向最活躍的神經單元,並利用不同的神經遞質觸發神經單元中不同類型的神經元。這是一個有趣的猜測,它是否真的存在還需要神經科學的進一步證實(我很確信它能得到證實)。不過,大腦內有這樣一個結構,看起來其作用與本文的最強選擇神經元非常相似,它就是腦幹網狀結構上行激活系統。

網狀結構上行激活系統沒有特異的感覺或運動功能;它發出的纖維彌散地投射到前腦(包括大腦皮層)、腦幹和脊髓的許多部分。它與覺醒、注意等高級功能密切相關。對於這個系統的更詳細的作用及工作方式,我沒能找到更多的資料,似乎腦科學家們尚未能對它有完整、詳細的了解。

本文中的選擇神經元與上行激活系統有一個共同點:它們都是形成反應的基礎。阻斷上行激活系統到皮層的通路,整個大腦會處於昏迷狀態;本文模型中如果阻斷選擇神經元的作用,控制輸出的B、C類神經元就不會被激活,這類似於大腦處於昏迷。

這個猜測是否成立應該不難驗證,有條件的神經科學工作者如果能在這個問題上做些研究,我相信會有另人振奮的結果。如果選擇神經元的存在能得到證實,那意味著大腦的秘密將被徹底揭開。

2、 皮層溝回

有證據顯示,大腦的皮層表面面積與智力高低有顯著的正相關關係。皮層溝回是為了在有限的腦容積內擴大皮層表面積。也就是說,大腦智能的提升,必須是在皮層表面方向進行擴張。為什麼皮層的表面積如此重要?

在本文的模型中,最強選擇是一切活動的基礎。選擇神經元發出的神經纖維末梢被最活躍神經單元所吸引,移動到該單元處與之形成臨時聯繫,觸發該單元相應類型的神經元。整個過程是動態的,選擇神經元發出的神經纖維末梢需要在不同的被選擇神經單元間移動。要確保這種移動的暢通,必須在皮層的表面進行。這就能很好的解釋為什麼皮層表面面積與智力高低相關:智力越高,意為著代表外部具體對象的神經單元越多,它們所形成的皮層表面積也越大。

3、 皮層分區

大腦皮層根據功能不同可劃分為很多分區,具有類似功能的神經元處於同一分區。

本文模型中選擇神經元的神經纖維末梢只能在一定範圍內移動,對代表某一類型對象的神經單元進行選擇。因此屬於同一類型對象的神經單元必須集中在同一區域。

4、 皮層的分層結構

大腦皮層在垂直於表面方向上,大體分為六層。除第一層主要由神經纖維、神經元樹突構成,其它層均由神經元構成。這種分層結構意味著不同層的神經元有不同的神經元類型,且具有不同的功能。

本文模型中,神經單元里不同類型的神經元就構成了皮層中的各個「層」。其中,A類神經元對應皮層中的第四層神經元,B類神經元對應皮層的第5、6層神經元,C類神經元對應皮層的第2層神經元。此外,在以後的實際模型里,我們還會發現在連接形式上本文模型與大腦皮層也有諸多相似之處(比如,皮層中所有輸入信號都進入第四層神經元,也就是本文中的A類神經元)。

5、 功能柱

在垂直於皮層表面的方向上,人們發現一些呈柱狀分布的神經元,在同一柱內的神經元有相同的感受野,這些柱體就叫「功能柱」

本文模型的神經單元中的不同神經元,對應同一個具體對象,且排列方向上垂直於表面。這與「功能柱」的特徵非常相像。

實際上這個模型所能解釋的大腦結構遠不止上述幾條。在以後的文章里會介紹到這個模型實現識別、學習、記憶等過程的原理,我們將會看到更多與大腦基本結構的可比之處。


推薦閱讀:
相关文章