編者注

本文全文摘錄自盧昌海著《黎曼猜想漫談:一場攀登數學高峰的天才盛宴》中的第18章「隨機矩陣理論」,文中有部分人名和數學術語的翻譯不同於我們常見,為了保持原文樣貌,這裡不作改動。 (嚴禁任何形式的商業轉載,如需轉載請聯繫原書作者)

(註:我看到這本書時,腦海中總是有似曾讀過的感覺,或許至少某個本科暑假曾經讀過黎曼猜想主題的書籍,但內容已經很難想起了。)


身為理論物理學家的戴森如何會研究起隨機矩陣理論來的呢?這當然還得從物理學說起。

我們知道,在物理學上可以嚴格求解的問題是少之又少的。而且物理理論越發展,可以嚴格求解的問題就越少。舉個例子來說,在牛頓萬有引力理論中二體問題可以嚴格求解,但一般的三體問題就不行[原書註:這裡的「單體」、「二體」、「三體」等指的都是點狀分布或可視為點狀分布的體系。]。到了廣義相對論中連一般的二體問題也解不出了,只有單體問題還可以嚴格求解;而到了量子場論中更是連單體問題也解不成了(因為根本就不存在單體問題了)。

另一方面,現實物理中的體系卻往往既不是單體,也不是二體或三體,而是多體。這「多」字少則十幾、幾十(比如大一點的原子、分子),多則 10^{23} (千萬億億)或更多(比如宏觀體系)。很明顯,對現實物理體系的研究離不開各種各樣的近似方法。這其中很重要的一類近似方法就是統計方法,由此形成了物理學的一個重要分支:統計物理(statistical physics)。

在統計物理中,人們不再著眼於物理體系的微觀狀態進行細緻描述(因為這種細緻描述不僅無法做到,而且對於確定體系的宏觀行為來說是完全不必要的),取而代之的是「系綜」(ensemble)的概念。所謂系綜,指的是滿足一定宏觀約束條件的大量全同體系的集合,這些體系的微觀狀態各不相同,但滿足一定的統計分布,而我們感興趣的體系的宏觀狀態則由相應的物理量在這些體系上的平均值——即所謂的系綜平均值——所給出。

在傳統的統計物理中,組成系綜的那些全同體系具有相同的哈密頓量(Hamiltonian)[原書註:哈密頓量是決定體系動力學行為的一個很重要的物理量。在量子理論中,體系的能級由哈密頓量的本徵值所決定。],只有它們的微觀狀態才是隨機的。但隨著研究的深入,物理學家們開始接觸到一些連這種方法也無法處理的物理體系,其中一個典型的例子就是由大量質子和中子組成的原子核。這種體系的相互作用具備了所有可以想像得到的「壞品質」(比如耦合常數很大,不是二體相互作用,不是有心相互作用等),簡直可以說是「五毒俱全」。對於這種體系,我們甚至連它的哈密頓量是什麼都無法確定。這樣的體系該如何處理呢?很顯然還是離不開統計的方法,離不開系綜的概念。只不過以前在系綜中哈密頓量是已知的,只有各體系的微觀狀態是隨機的,現在卻連哈密頓量也不知道了。既然如此,那就「一不做、二不休」,乾脆把哈密頓量也一併隨機化了。由於在量子理論中哈密頓量可以用矩陣來表示,因此這種帶有隨機哈密頓量的系綜可以用隨機矩陣理論(random matrix theory)來描述。這一點最早是由美籍匈牙利數學家及物理學家威格納(Eugene Wigner,1902——1995)於1955年提出的。[原書註:當然,在隨機矩陣本身的提出上,數學家還是要先於物理學家。隨機矩陣在數學上最早是在1928年由蘇格蘭統計學家威沙特(John Wishart,1898——1956)提出的。]

當然,把哈密頓量隨機化不等於說對哈密頓量的結構就沒有任何限制了。20世紀60年代初,與蒙哥馬利在茶室里偶遇的這位戴森對隨機矩陣理論進行了深入研究,並在1962年一連發表了五篇非常漂亮的論文。這些論文在隨機矩陣理論的發展史上具有奠基性的作用。在這些論文中,戴森證明了由隨機矩陣理論所描述的物理體系可以按照其在時間反演變換T的作用下的變換性質,而分為三種類型:

? 如果體系不具有時間反演不變性,則體系的演化算符為幺正矩陣(酉矩陣,unitary matrix)。

? 如果體系具有時間反演不變性,且 mathrm{T}^2 = mathrm{I} (I為單位矩陣),則體系的演化算符為正交矩陣(orthogonal matrix)。

? 如果體系具有時間反演不變性,且 mathrm{T}^2 = - mathrm{I},則體系的演化算符為辛矩陣(symplectic matrix)。

這裡戴森用演化算符U取代了哈密頓量H,這兩者之間由U = exp (-iHt)相聯繫。用演化算符的好處是它的參數空間是緊緻(compact)的。

除了利用對稱性對體系演化算符的結構進行分類外,還有一個需要解決的問題,就是哈密頓量的分布函數。戴森引進的是高斯型分布,這是數學物理中比較常見的一種分布。在這種分布下具有上述三種對稱性的系綜分別被稱為:高斯幺正系綜(Gaussian unitary ensemble,GUE)、高斯正交系綜(Gaussian orthogonal ensemble,GOE)和高斯辛系綜(Gaussian symplectic ensemble,GSE)。

戴森在得知了蒙哥馬利的密度函數時猛然想起的「隨機厄密矩陣」所描述的正是這三種系綜中的一種——高斯幺正系綜——的哈密頓量(因為高斯幺正系綜的演化算符是幺正的,所對應的哈密頓量則是厄密的),它的幾率測度定義為高斯型分布:

P(H) dH = C exp left[ - frac{tr (H^2)}{2 sigma^2} 
ight] dH,

其中C為歸一化常數;H為體系的哈密頓量; sigma 為標準差(通常取為 2^{-1/2} )。

有了哈密頓量,接下來要關注的當然就是能級分布。對於一個量子體系來說,能級分布無論在理論還是觀測上都是極其重要的性質。這也是隨機矩陣理論中物理學家們最感興趣的東西之一。物理學家所說的能級用數學術語來說就是哈密頓量的本徵值(eigen value)。那麼隨機厄密矩陣的本徵值是怎樣分布的呢?分析表明,一個N階隨機厄密矩陣的本徵值的分布密度為

P(lambda_1, lambda_2, dots, lambda_N) = C exp left[ - sum_i lambda_i^2 
ight] prod_{j > k} (lambda_j - lambda_k)^2,

其中 lambda_1, lambda_2, dots, lambda_N 為本徵值;C為歸一化常數。

通過對這一分布密度的積分,我們可以計算出隨機厄密矩陣本徵值的各種關聯函數。但是這些關聯函數的表觀複雜程度與本徵值的平均間距有很大關係,因此我們要先對本徵值做一點處理,以便簡化結果。這一處理所依據的是威格納曾經證明過的一個結果,那就是當矩陣階數 N 
ightarrow infty 時,N階隨機厄密矩陣的本徵值分布趨近於區間 left[-2 (2N)^{1/2}, 2 (2N)^{1/2} 
ight] 上的半圓狀分布,即

P(lambda) d lambda = frac{(8N - lambda^2)^{1/2}}{4 pi} d lambda,

其中 P(lambda) d lambda 為區間 left(lambda, lambda + d lambda 
ight) 上的本徵值個數。這一規律被稱為威格納半圓律(Wigner semicircle law)。利用這一規律,我們可以對本徵值做一個標度變換,引進

mu = lambda frac{(8N - lambda^2)^{1/2}}{4 pi},

可以證明(請讀者自己證明),這一變換就像我們在第16章中對黎曼 zeta 函數零點虛部所做的處理將零點的平均間距歸一化那樣,將本徵值的平均間距歸一化為了 Delta mu sim 1。在這種間距歸一化的本徵值下,關聯函數的形式變得相對簡單,其中對關聯函數的計算結果為

P_2(mu_1, mu_2) = 1 - left[ frac{sin (pi |mu_2 -mu_1|)}{pi |mu_2 - mu_1|} 
ight]^2

看到這裡,大家想必也和戴森一樣看出來了,隨機厄密矩陣本徵值的對關聯函數正是我們在第16章中介紹過的,蒙哥馬利所猜測的黎曼 zeta 函數非平凡零點的對關聯函數!當然,那時候蒙哥馬利用的不是像「對關聯函數」這樣摩登的術語,事實上「對關聯函數」這一術語蒙哥馬利在與戴森交談前連聽都沒聽說過,他自己用的是像「我正在研究零點間距」那樣土得掉渣的「白話文」。

有些讀者可能會提出這樣一個問題,那就是哈密頓量的分布為什麼要選擇成高斯型分布?對於這個問題,實用主義的回答是:高斯型分布是數學上比較容易處理的(不要小看這樣的理由,當問題複雜到一定程度時,這種理由有時候是最具有壓倒性的);稍為深刻一點的回答則是:高斯型分布在固定的 |H|^2 系綜平均值及標準差下具有最大的熵,換句話說它所描述的是在一定的約束之下具有最大隨機性的體系;但最深刻的回答卻是:我們其實並不需要特意選擇高斯型分布!隨機矩陣理論的一個非常引人注目的特點便是:在矩陣階數 N 
ightarrow infty 的極限下它的本徵值分布具有普適性(即不依賴於哈密頓量的特定分布)。正是這種普適性使得隨機矩陣理論在從複雜量子體系的能級分布到無序介質中的波動現象,從神經網路系統到量子混沌,從 N_C 
ightarrow infty 的QCD到二維量子引力的極為廣闊的領域中都得到了應用。

但即便把隨機矩陣理論在所有這些不同尺度、不同維度、不同領域中的應用加在一起,似乎也不如它與黎曼 zeta 函數非平凡零點分布之間的關聯來得神奇。蒙哥馬利曾經為不知道自己的結果預示著什麼而苦惱,現在他知道了那樣的結果也出現在由隨機矩陣理論所描述的一系列物理現象之中。

但這是解惑嗎?這與其說是解惑,不如說是一種更大的困惑。像黎曼 zeta 函數非平凡零點分布這樣最純粹的數學性質,怎麼會與像複雜量子體系、無序介質、神經網路之類的最現實的物理現象扯上關係呢?這種神奇的關聯本身又預示著什麼呢?


更多內容,請閱讀原書!

並祝微信群好友及所有讀者,Merry Christmas!


推薦閱讀:
相关文章