本系列完整PDF版本下載:pan.baidu.com/s/13sqxtC

經濟計量學與經濟學經驗方法的發展

經濟學研究的是真實世界的事件。因此,下列事實並不令人感到奇怪,即大多數關於是否應當接受這種而不是那種經濟理論的爭論都涉及經驗方法,這些方法將關於經濟過程的理論觀點與對真實世界的觀測相連接。問題大量存在。存在將理論與現實相連接的方式嗎?如果有這樣的方式,是否不止一種?對真實世界的觀測,提供了對理論的有效檢驗嗎?與非正式的啟發式的識別力相對應,對經濟現象直接而有目的的觀測,能在多大程度上推進我們對經濟事件的理解?考慮到數據的不明確,形式上的理論化只是在玩花招嗎?經濟學應當更多地關注直接觀測與常識嗎?在本章中我們將簡要地考察經濟學家在這些問題上所做出的努力。他們的努力開始於簡單觀測,然後轉向統計學,再轉向經濟計量學,最近轉到了校準、模擬以及實驗研究上。

對於經濟學經驗方法的爭論,有微觀經濟上的看法,也有宏觀經濟上的看法。微觀經濟看法在極大程度上涉及生產函數與供求曲線的經驗檢驗;宏觀經濟看法一般涉及宏觀經濟關係及其與個人行為相聯繫的經驗檢驗。宏觀經濟檢驗問題包括所有的微觀經濟問題,外加其他更多的問題,所以,與微觀經濟學的經驗研究相比,對宏觀經濟學的經驗研究爭論更多就不足為奇了。

我們首先對不同經濟學家所使用的四種經驗方法進行一般性的陳述,以此開始我們的考察,然後著眼於經濟學家將統計研究與非形式化的觀測相結合的早期嘗試。接著我們來了解,針對數據統計處理這一問題,合理但特別的決策是怎樣做出的,並且怎樣導致了經濟學分支一經濟計量學的發展。最後,我們考察這些較早的特別決策,怎樣使得一些經濟學家對經濟計量研究以及今天經驗經濟學的未決狀態進行冷嘲熱諷。

經驗經濟學

幾乎所有的經濟學家都認為,經濟學最終必定是一門經驗學科,他們大於經濟體如何運轉的理論,必須與真實世界的事件及數據相連(如有可能的話,再進行檢驗)。但是,關於如何去做,以及能得出什麼含義,經濟學家之間則有很大的分歧。我們將區分把理論與真實世界相連的四種不同方法:通常經驗論、統計分析、古典經濟計量方法以及貝葉斯經濟計量分析。

通常經驗論是藉助最少的統計手段,通過對真實世界中事件的直接觀測,將理論與現實相連的一種方法。你著眼於周圍的世界,並確定它是否與你的理論主張相符,這是19世紀後期之前,大多數經濟學家處理經濟問題的方式。在那之前,大多數經濟學家並沒有接受過多少統計方法的訓練,運用統計方法所必要的數據也不存在,我們現在認為理所當然的很多標準的統計方法尚未得到發展,計算能力也有限。

通常經驗論有時被輕莽地稱作閉門造車的經驗論。這一帶有貶義色彩的術語表達了下列意義,即某人坐在書桌旁開發了一種理論,然後有選擇性地挑選數據和事件來支持這一理論。支持通常經驗論的人反對這種描述,原因在於這種方法包含了仔細的觀測、多領域的研究、案例分析,以及與經濟事件和所研究的制度的直接接觸。通常經驗論的支持者認為,能夠對個人加以訓練,使之面對現實世界中的廣泛事件;個人能夠客觀地評價他們的理論是否與那些事件相符。通常經驗論要求經濟學家以經過專門訓練的眼光,不斷地觀察經濟現象,從而留意其他人錯過的東西。並不存在一個精確的劃分界限來最終確定是應當還是不應當接受一個理論,但確實存在一個不精確的界限。如果你預期一種結果,但出現的卻是另一種結果,你就應當向理論提出質疑了。研究者為他自己的誠實度設置了分界線。

統計分析方法也要求著眼於現實,但是,它強調能夠被量化從而能面對統計度量和分析的事件。其關注的焦點經常放在統計分類、度量以及描述經濟現象上。這種方法有時被戲稱為沒有理論的度量(measurement without theory)。該方法的支持者反對這種描述,認為它只不過是考慮到很多理論中的可能性,並允許研究者選擇最相關理論的一種方法。他們聲稱,這種方法能夠防止預先考慮的理論引導對數據的解釋。

統計分析方法與通常經驗論非常相似,但是,與通常經驗論不同,統計方法運用任何可以利用的統計工具和技術,從每一組數據中得出全部的認知。它並不試圖將數據與理論相連接;取而代之的是,它讓數據(或者分析數據的計算機)來說話。隨著計算機技術提高了研究者從統計上分析數據的能力,通常經驗論方法與統計分析方法就分離了。

古典經濟計量方法(classical econometric)是一種將理論與數據直接相連的經驗分析方法。研究者通常的敏感性,或者他對現象的理解,在實驗分析中只起著非常小的作用;古典經濟計量學家只不過是能使數據對理論進行檢驗的技術員。這種方法是利用了古典統計方法來從形式上檢驗一種理論的有效性。經濟計量方法形成於20世紀30年代,現在它是現代經濟學系所講授的最具代表性的方法。其歷史是本章主要關注的內容。

貝葉斯方法直接將理論與數據相連,但是,在任何統計檢驗的解釋中,它所採取的觀點都是:檢驗並不是確定的。它以統計學的貝葉斯方法為基礎,該方法並不是將或然性法則作為一種客觀法則,而是作為主觀信仰程度來加以探討。在貝葉斯分析中,統計分析不能被用來確定客觀事實;它只能是得出主觀判斷的一種輔助手段。因此,研究者只不過是運用統計檢驗來修正他們的主觀看法。貝葉斯經濟計量學是通常經驗論的一種技術擴展。在貝葉斯經濟計量學中,數據與數據分析並不回答問題,它們只是輔助研究者進行判斷的工具。

這些方法並不完全相互排斥。例如,在最初開發一種理論時,人們可以利用通常經驗論,然後運用經濟計量學來檢驗理論。類似地,貝葉斯分析要求研究者藉助一些可供選擇的方法,例如通常經驗論,得出他們自己偏好的結論。然而,統計學的貝葉斯方法與古典解釋是相互排斥的,每個研究者最終必須選擇一種或者另一種。

技術不僅影響經濟體本身,而且影響經濟學家用來分析經濟體的方法。因此,計算機技術在經濟學家接近經濟體並進行經驗研究方面具有重要的影響就不足為奇了。正如一位觀察家所指出的:如果汽車經歷了與計算機同樣的技術進步,法拉利將只賣到50美分。這還不能改變你的駕駛習慣嗎?計算機無疑改變了經濟學家的經驗研究,未來它會更加如此。

在一些情況下,技術僅僅使得我們已經在做的事情變得更容易做了。例如,統計檢驗現在能夠藉助計算機在形式上得以完成。具有更複雜力學的遞歸系統正在尋找更多的觀眾。貝葉斯度量開始在標準計算機軟體統計程序中露面。另一群經濟學家正在運用一種向量自動回歸(VAR)萬法。他們只是照看著計算機,以期找到獨立於任何理論的數據模式。

另一組變化比演進更加革命。最近,一群實驗經濟學家一直在更多地關注代理人建模。這些都是模擬,其中,不同種類代理人的地方化的個人最大化目標被具體化和模型化。但是結果被加以模擬,以確定繼續存在的策略,而不是通過演繹來確定。在這些模擬中,允許個人逐步確立制度並進行聯合,並提供了一個與真實世界現象更加接近的相似物。

我們了解到的另一種變化是發展與利用一種稱作宏觀經濟模型校準的方法。模型不再進行經驗檢驗;取而代之的是,它們被加以校準,來看經驗證據是否與模型預測的結果相符。在校準中,除簡單的動態時間序列平均數之外,也強調簡單的一般均衡模型的作用,其參數是通過內省確定的。作為經驗研究的一個主要目標,統計上的「適合」明確地被否定。就校準所準確表明的內容而言,存在著爭論,但是,如果一個模型不能被校準,它就不應該被保留。

最後一個變化是經驗研究的「自然實驗」方法的發展。這種方法利用來自直覺的經濟理論,而不是結構模型,並且運用自然實驗作為數據點。

數理經濟學、統計學以及經濟計量學

在我們考察經濟計量學的發展之前先人簡要地考慮一下數理經濟學、統計學以及經濟計量學之間的區別是值得的。它們經常被集合在一起,雖然不應當這樣。

數理經濟學(mathematical economics)這一術語僅指將數學方法用於闡述假設。它是用來形成假設並闡明其含義的形式化且抽象的分析。統計學(statistics)這一術語指用數字表示的觀測資料的集合,統計分析指的是運用得自概率論的統計檢驗,來獲得對那些用數字表示的觀測資料的見解。經濟計量學(econometrics)結合了數理經濟學與統計分析,前者用來闡述假設,後者用來在形式上檢驗假設。這種結合併不是對稱的;人們不用從事經濟計量學就能從事數理經濟學,但是,不首先從事數理經濟學,就不能從事經濟計量學。只有數理經濟學,才能給予人們一種足以明確地在形式上被檢驗的理論。

我們能夠看到數理經濟學與統計學在歷史上的分離。19世紀後期,最強烈反對經濟思想數學闡述的經濟學家,是德國歷史學派以及美國制度學派的先驅者。這群人中包括數據收集和統計分析的一些積極倡導者——他們認為,在對真實世界的某種現象進行有意義的理論概括之前,必須了解這種現象表明了什麼。另外,那一時期很多正規的理論家對於運用統計分析猶移不決。例如,馬歇爾與埃奇沃斯都對運用統計度量需求曲線的能力猶疑不決,他們認為,用來解析性地導出曲線的其他條件保持不變的假設,使得曲線難以量化。埃奇沃斯在帕爾格雷夫經濟學大辭典(1910年版〉中論述需求曲線時寫道:「傑文斯運用統計學構建需求曲線的希望是否能夠實現,可能令人懷疑。」

經濟學家希望從數理經濟學中獲得的,是假設檢驗的精確性,這種精確性使得減少檢驗的含糊性成為可能。例如,他們希望不依賴於常識以及對需求曲線向下傾斜的通常啟發式的理解,就能夠在經驗上證明需求曲線向下傾斜。在對經濟理論進行數學闡述之前,經濟學家運用文字來陳述經濟理論和假設,一般通過與現有情況或者歷史事件相比來進行一般性假設的檢驗。但是,在兩種情形下,統計學的運用都是最小限度的。這種本質上是誘導式的方法,並沒有使得假設以一種為正規的經濟學家所認同的方式被加以檢驗。

20世紀60年代與70年代,形式上的統計檢驗以及對經濟計量方法的了和解都有了巨大進展。計算機技術的進步使得進行極為複雜的經驗研究成為可能。較早要花幾天時間完成的統計檢驗,現在可能只需要幾秒鐘。在那一時期,對經濟計量學的期望很高。一些人認為,經濟計量學將使經濟學成為一門科學,其中,所有的理論都能被加以檢驗。在此期間,邏輯實證主義與波普爾證偽主義是占統治地位的方法。人們認為,過去的錯誤——以一種導致理論無法檢驗的方式來闡述理論——能夠被加以避免。時至今日,最初的這些願望大多數尚未得到實現。

早期的經驗研究

為需求關係增加經驗基礎的早期嘗試是格利高里·金(Gregory King,1648–1712)的研究,他重申了查爾斯·戴維南特(Charles Davenant,1656–1714)的一些研究。戴維南特在《論如何使一個民族在貿易平衡中成為獲利者的可能方法》中,描述了價格與數量之間大致的相反關係。在書中,他提出了下列法則。我們認為,歉收可能會以下列比例提而穀物的價格:

所以,當穀物價格上升到通常價格的三倍時,可以假定歉收了通常產量的1/3以上;如果歉收了通常產量的5/10或者說一半,價格將上升為通常價格的近五倍。

可檢驗與不可檢驗的理論:馬爾薩斯的人口理論馬爾薩斯對人口理論的陳述是不可檢驗理論的一個很好例證。在其《人口原理》第一版中,馬爾薩斯提出了下列假設,即長期中人口趨於以比食物供給更快的速度增加。這一假設極有可能在統計上被予以反駁。

然而,在其《人口原理》第二版以及後來的版本中,馬爾薩斯又說,人口主題不能在經驗上進行檢驗;他補充了一種無法度量的人口控制,即「道德控制的增長」,指的是婚姻的推遲以及婚前性行為的節制。當把道德控制作為對出生率的控制增加到理論中時,觀測到的人口增加可能與上升的、下降的以及不變的人均收入相結合,並且仍然符合理論。因此,馬爾薩斯人口理論的這一版本,變得無法進行經驗檢驗。

新古典經濟學與經驗分析

經驗研究的早期嘗試是例外而不是慣例。17世紀後期,大多數古典經濟學家採取通常經驗論方法。他們就經濟體如何運轉的規律進行假設,並用實例來支持這些規律。因為不存在公認的對一種理論的檢驗,所以,有關什麼理論是正確的爭論就一直進行著。

19世紀後期,隨著新古典經濟學的開始,這種方法出現了問題。正如我們在第三部分看到的那樣,新古典理論變得比較形式化,存在著關於經濟學成為一門精密科學的論述。這意味著經濟學家經驗研究的方法形式化,討論得最多的是自身正在經歷一場革命的統計分析方法。

新古典經濟學家採用很多不同的統計分析方法。例如,威廉·斯坦利·傑文斯把統計學看做是將經濟學變成一門擁有精密法則的精密科學的方法。另外,萊昂·瓦爾拉斯則很少從事經驗研究;他不斷地發展其與經驗檢驗可能性無關的理論。阿爾弗雷德·馬歇爾相信經驗研究,但並不進行形式上的統計分析,他把直接觀測與通常經驗論看做是收集經驗信息的最有效方式。

享利·L·穆爾

19世紀末期20世紀初期,統計方法與概率理論的重大研究,使得它們被運用到經濟學中。將形式化的統計方法運用於經濟學的最早提倡者之一是亨利·L·穆爾(Henry L. Moore,1869–1958)。20世紀初期,穆爾最先使用了很多統計方法,這些方法後來都成了標準。穆爾應用了弗朗西斯·高爾頓盟士、卡爾·皮爾森以及其他人的統計研究。這些統計學家證明,有可能在一個可控制的環境中,運用復相關與相依表,根據統計數據,在形式上確定推論。這項研究給稱穆爾留下了深刻印象,他斷定有可能將這些統計方法應用於經濟理論的檢驗中。

不像傑文斯那樣僅僅「目測」同一坐標方格中的兩張圖表,穆爾在形式上比較了兩個系列的數據,並發展了統計學,使之能夠為他提供有關這兩組數據之間關係的信息。然而重要的是,要注意到他這樣做,是對皮爾森研究的勇敢突破,後者僅僅分析在其他實物影響能夠被加以控制的環境中所進行的研究。穆爾沒有這種奢求,因為在經濟學中受控制的實驗通常是不可行的;因此他假定在受控制的實驗中使用的統計方法,在不受控制的環境中也有效。

他特別有興趣進行檢驗的理論是約翰·貝茨·克拉克的工資的邊際生產力理論,該理論預言個人將被支付其邊際產品。為了達到檢驗上目的,穆爾研究了工資與邊際生產力、個人能力、罷工以及行業集中之間的關係。克拉克的理論意味著:(1)與低能力的個人相比,具有較高能力的個人將被支付更多工資;(2)能力相當的個人在壟斷性行業和競爭性行業工作時,在壟斷性行業工作的人將被支付更多工資;(3)與非集中性行業相比,集中性行業為了較高工資而進行的罷工更有可能獲得成功。

穆爾發現了能力與工資之間的關係,但是,他的分析中也存在著重大問題。在其檢驗中,穆爾並沒有非常嚴格地詳細說明他的理論結構。例如,在某個檢驗中,他運用平均產品而不是邊際產品進行檢驗,結果並沒有檢驗實際工資,而是檢驗了貨幣工資。穆爾也發現了罷工與行業集中之間的關係,但是,這種關係只基於有限的數據

穆爾的統計研究也是有問題的,原因在於,他不僅對簡單地從科學上檢驗克拉克的理論感興趣,對與政策相關的問題也有著濃厚的興趣。他希望利用他的統計分析來反對要求更多收入平等的社會主義政策建議。有「私心」並不一定使理論或經驗研究的結果無效,但是,人們確實質疑含糊不清的結果是否將被合理地加以闡釋。發覺一個理論家或經濟計量學家的動機,並不是對一種假設或理論有效性的檢驗。研究有時發生在受到資助的智囊團中,這些智囊團反映了特定的意識形態,只要研究結果成了能被所有人檢驗的公共財產,那麼,重大的偏差就有可能被指出來。

穆爾的早期研究使他被確立為將統計方法與經濟學相結合的領導者。他後來的貢獻——一個是對需求曲線的經驗度量,另一個是對經濟周期的度量——也都很重要:前者奠定了現代微觀經濟計量學的基礎,後者構成了現代宏觀經濟計量學的基礎。

穆爾的需求曲線與確定問題

穆爾最為著名的研究也許是他對農產品和生鐵需求曲線的估計。對其貢獻進行仔細分析是有正當理由的,原因是它指出了經驗估計中的很多問題,這些問題在後來的爭論中起到一定的作用。

考慮一下從經驗上度量一條需求曲線的困難。市場觀測值是交易發生時價格與數量的結合。如果市場處於均衡狀態,觀測到的價格與數量就是既在供給曲線上也在需求曲線上的點;如果市場不處於均衡狀態,觀測到的價格與數量可能在供給曲線上,也可能在需求曲線上,或者兩條曲線上都沒有。研究者怎麼知道是哪種情形?如果研究者能夠進行可控制的實驗,並保持所有其他條件不變,就像在下列方程中一樣:

Q_D=f(P_Q,所有其他產品的價格,偏好,收入,…)\ Q_s=g(P_Q,生產要素的價格,技術,…)\ Q_e=h(f,g)

方程中,除了價格與數量之外,其他任何條件都保持不變,然後,人們就能度量價格與數量之間的實際關係。但是,在做不到這一點的地方(藉助經濟統計學無法做到的地方),研究者不知何故一定要將觀測到的價格與數量的數據和理論相連。這裡就展現出了經濟計量問題的核心:將從不可控制的實驗中觀測到的數據與理論相連。

在他對農業市場的分析中,穆爾樂於接受下列假設,即市場趨向於均衡,所以觀測到的價格與數量能被假定為是均衡價格與數量即 PeQe,它們是既在供給曲線上又在需求曲線上的點。在[fig:equiliass]中能夠看到這一假設。它使我們假定,觀測到的點是諸如(Pe,?Qe)而不是 (P1,?Q1)的點,在點 (P1,?Q1)上,市場處於向均衡調整過程中的非均衡。

穆爾也樂於假設,對於農業商品來說,供給外生地由夏季降雨量來決定,所以,不受當前收穫時期價格的影響。他進一步含蓄地假設,過去的事件對於供給和需求沒有影響,並且,變化著的預期對實際數據的確定不起作用。這些假設改變了模型的圖形,由[fig:moreassu]呈現出來。因為供給量被假定為外生決定,所以,所估計的點(P1,?Q1)和(P2,?Q2)一定是需求曲線上的點。

為了完成其分析,穆爾將數據表示為圍繞某一趨勢的百分比變化,並按照百分比的變化得出需求關係。他提出了一條線性方程的需求曲線和一條三次方程的需求曲線。線性需求曲線具有一般形式:P?=?a???bQ,式中 P為價格,a是需求曲線的價格截距,b是需求曲線的斜率,Q為數量。負號的 b係數表明向下傾斜的需求曲線。穆爾運用下列係數,估計了兩種不同的曲線:

$$egin{gathered} Delta P/P_{t-1}= 7.8 - 0.89 Delta Q/Q_{t-1}\ R^2=0.61, s=16 shortintertext{以及} Delta P/P_{t-1}=1.6-1.1 Delta Q/Q_{t-1}+0.02(Delta Q/Q_{t-1})^2 - 0.0002(Delta Q/Q_{t-1})^3\ R^2=0.71, s=14end{gathered}$$

注意到在兩種情形中,需求曲線都具有理論所預言的負號(它是向下傾斜的),並且具有相當高的可決係數。

穆爾所估計的需求曲線並沒有立刻給他帶來讚譽;很多人不明白他的成就,確實明白的一些人(例如埃奇沃斯)斷言,考慮到基礎理論的複雜性,經驗需求分析顯得過於簡單。埃奇沃斯主張,構成結論基礎的未經檢驗的假設非常多,拘泥於形式並沒有什麼好處。這些批評儘管是實質性的,且仍然在不同程度上被視同反對經濟計量研究,但是這些批評不應當被看成是貶低穆爾的貢獻。他是從統計上度量需求曲線的最早的經濟學家之一,雖然像南希·伍維克指出的那樣,尚不清楚穆爾是否打算估計一條傳統需求曲線。

對穆爾農業需求曲線估計的淡漠認同,與對其生鐵需求估計的淡漠接受相比,前者相當於一種積極的恭維。穆爾聲稱,生鐵的需求曲線斜率為正數,所以,當價格上升時,需求量也上升。他提出了下列需求方程:

ΔP/Pt???1?=?4.48?+?0.5211ΔQ/Qt???1

穆爾聲稱發現了一條正斜率的需求曲線,從而直接反對微觀經濟理論,這引起了強烈的批評性回應。

考慮到穆爾作為一位經濟理論家所具有的複雜頭腦,伍維克指出,穆爾的正斜率需求曲線並不是錯誤造成的結果,也不是未能理解確定問題(為了估計另一條曲線,需要保持供給或需求不變)的結果。根據伍維克的觀點,它代表了解決數據局限性的一種嘗試,並允許這些局限引導其分析,而不是讓理論分析引導其經驗研究。這一觀點得到了下列事實的支持,即在穆爾的著作中,他很清楚其需求曲線並不是根據馬歇爾的理論得出的一條典型的需求曲線,而是一條與經驗規律有關的動態需求曲線,涉及很多互動式變化。

很多相互影響能夠使穆爾的動態需求曲線符合靜態需求理論。例如,當生鐵價格上升時,總收入與經濟活動有可能增加,這就與需求的增加相連。因為不可能外生地說明生鐵的供給(估計靜態需求曲線時,這是必要的),所以穆爾認為,他的動態需求曲線抓住了經驗規律,從而在對經濟體進行預測時是一種有用的工具。

穆爾認為,儘管不能外生地說明供給,但人們可以估計一條曲線,它包含了對可度量的供給相關變動的正常反應。這些正常反應包括以一種前後一貫的方式使靜態需求曲線變動;並使得被度量的且包含相互依賴關係的動態需求曲線向上傾斜。如果後來的這些相互依賴關係是正確的,那麼,無論何時我們看到主要行業產品供給外生地增加,我們都將會預期到這些行業的產品價格上升,而不是下降。這就是穆爾的結論。穆爾認為,基本上不需要將這一動態需求曲線與基礎性的靜態理論相連,原因在於,這樣做只是一種訓練,並不能令人信服。他寫道:

根據統計方法即其他條件保持不變的方法,解釋現象時所遵循的適當過程是:在理論上依次調查每種要素對價格的影響,假定其他條件保持不變,然後最終進行綜合!但是,如果發生每種要素與價格的聯繫,那麼,其他條件保持不變的假設,就涉及大量的且至少是有問題的假設,當人們談到多種影響的最終綜合時,難道不會完全使自己迷失在含蓄假設的路途中嗎?我們不採用這種令人困惑的方法,而是遵循著相反的過程,完全具體地著手處理價格與供給關係的問題。

統計相關性理論的富有成效,與上述方法的總無成果,形成了強烈對比,兩種方法在處理多重影響問題上遵循著相反的過程。例如,考慮一下天氣對農作物的影響問題。在假定方式下,假定其他未被列舉的天氣因素保持不變,試圖解決關於降雨量對農作物的影響問題,這是怎樣一種毫無價值的思考?有關溫度影響的問題,也能保持其他條件不變嗎?最後,一種綜合怎麼能由多種個別影響組成呢?多重相關性的統計方法則沒有帶來這種無益的問題。它直接質詢農作物與降雨量之間的關係是什麼,不用保持其他條件不變,其他事物根據它們的自然狀況而變化,

穆爾研究中的合理因素涉及經濟計量學中一些尚未解決的相關問題。它們提供了關於制度主義學派經驗方法的觀點,即數據應當引導理論分析,而不是理論引導經驗研究。經濟學專業越來越意識到靜態分析的局限性,並開始將這種分析與經驗觀測相結合,近來為穆爾研究所做的辯解就是在這樣一種氛圍中進行的。在穆爾所處的時代或20世紀中期這種辯解並沒有出現。穆爾受到了來自兩個方面的抨擊——那些反對形式化的理論與經驗研究的人,這些人認為他的統計方法太複雜,以及那些贊同形式化的理論與經驗研究的人,這些人認為穆爾未能將足夠的注意力放在理論上。

儘管在專業中留下了不可磨滅的痕迹,但穆爾忍受著對其向上傾斜需求曲線的奚落,並最終放棄了經濟計量研究。這使得他的學生來完成經驗革命。在他的學生中,最著名的是享利·舒爾茨(Henry Schultz,1893一1938),他的《需求與供給的統計法則》(1928)和《需求理論及計算》(1938)在現代微觀經濟計量學的發展中發揮了重要作用。

亨利·舒爾茨與自變數和因變數

亨利·舒爾茨的貢獻是從他對關稅的分析中派生出來的,對關稅的分析要求估計一條需求曲線。當試圖估計需求曲線時,舒爾茨獲得了一個引人注意的發現:正如穆爾所進行的研究那樣,通過價格對數量進行回歸,而不是數量對價格進行回歸,人們能夠得到完全不同的彈性。在論述這些問題時,舒爾茨認為,如果對於哪種變數是所要回歸的正確變數(哪種是自變數,哪種是因變數),人們有一種居先的觀點,那麼,這一觀點將決定選擇的正確性。然而,如果人們並沒有一種居先的觀點,就沒有辦法在兩者之間選擇。舒爾茨認為,在這種情況下,選擇能夠較好地符合由皮爾森卡方測驗所確定的回歸是最好的。

舒爾茨的見解是重要的;它意味著不能獨立於理論來考察統計度量。你所看到的,部分地取決於你所相信的。這一見解促成了當前經濟計量學要求研究者仔細區分自變數與因變數的習慣。

當然,說到統計度量的變化與理論有關,並不是說度量完全取決於理論。它不表明理論是決定性的;理論只是提供了一種人們能夠從統計學中得出的有限解釋。

宏觀經濟學與經驗分析

微觀經濟學的經驗研究比較困難,但是,在宏觀經濟學中它更加困難,原因在於萬事萬物都傾向於相互關聯。最早的貢獻之一是威廉·斯坦利·傑文斯做出的。

傑文斯的日斑理論

威廉·斯坦利·傑文斯是數理方法與效用理論的先驅者之一。他因這些研究而獲得了高度的稱讚。儘管傑文斯現在最為人所知的是他對新古典理論的微觀經濟貢獻,然而,他在度量宏觀經濟關係方面的經驗嘗試,在經濟計量學史中最為著名。他的研究是早期形式化宏觀經濟經驗研究的嘗試之一。雖然他在微觀經濟學中的研究得到了讚譽,然而,他關於經濟周期的宏觀經濟統計研究並沒有得到經濟學界的充分認同。事實上,他經常受到奚落。

傑文斯對挖掘導致價格波動的貿易或經濟周期原因感興趣。因為循環行為看上去並不與個人效用最大化行為相關,所以,他認為自然界中一定存在某種原因——一些引起波動的自然現象。初步的研究使他認為,經濟活動波動的原因很有可能是與天氣有關的某種東西。他把注意力集中在太陽黑子(太陽活動的周期性波動)上,將其視為可能的原因。1

傑文斯的具體假設是,太陽黑子循環以 11.1年為一個周期而發生,這些循環導致了天氣的循環,從而導致經濟周期。為了驗證他的理論,傑文斯著眼於13世紀和14世紀以來可供使用的有關收成波動的農業數據。其後,他試圖將這些收成波動與19世紀對太陽黑子活動的估計,即11.1年一個周期的估計相連。他假設日斑循環的長度不變,通過在代表 11年的一個網格上展示數據,並目測數據,對兩者進行比較。他注意到了一種相對來說較好的「適合」,循環看上去匹配。然後,他考察19世紀期間商業信用的周期,並發現平均周期是 10.8年。他斷定,經濟周期的可能原因是太陽黑子。

傑文斯的日斑理論沒有被19世紀的經濟學家所採納,大多數人認為它相當怪異。它之所以值得提及,主要是因為它是運用統計學來形成並檢驗一種宏觀經濟理論的嘗試,並因此為傑文斯確立了經濟計量方法先驅者的地位。

穆爾對宏觀經濟計量學的貢獻

商業循環是一種持久的經濟現象,因而,穆爾對估計農作物需求所做的貢獻,因其宏觀經濟貢獻而得到加強,這就不足為奇了。在宏觀經濟計量學中,穆爾的主要貢獻是,既提供了商業循環理論,也試圖從統計上上度量它。在分析商業循環時,穆爾的動態需求曲線獲得了更多的正當理由。儘管存在一種靜態需求理論,然而,並不存在類似的商業循環理論。穆爾認為,演繹的和其他條件保持不變的推論,對於解釋這種波動是沒有幫助的。

像傑文斯一樣,穆爾選擇天氣的循環作為經濟波動的外生原因。他將這一觀點與他向上傾斜的生鐵需求曲線相結合,作為對於商業循環的解釋。他的五個論點如下所示:

(1)下雨增多且農作物產量增加;(2)貿易差額上升;(3)生產者產品的需求、價格以及數量上升;(4)就業增加,因此農作物的需求增加;(5)物價上升。

當雨量減少時,過程相反。穆爾運用統計分析來支持這一主張。

穆爾的原創分析受到了菲利普·賴特的批評,後者在1915年的一篇文章中,將雨量的度量調整為與生長有關的雨量,而不是全年的總雨量。賴特的研究顯示,統計關係中斷了。賴特的觀點有力地動搖了穆爾的統計分析,這促使穆爾將其覆蓋面擴展到更多的國家。在其擴展分析中,穆爾發現持續存在著一個八年周期。1923年,他創作了關於這一主題的第二部更加精細的著作,其中,他將天氣設置為諸多經濟和社會原因之一。

理論的擴展使之將多重原因包含進來,這使理論獲得了合意的支持,但是他對天氣周期的深入分析,強調金星在八年間隔中位於地球與太陽之間,這導致他的理論被冠以「商業循環的金星理論」的稱號。穆爾研究商業循環的特定方法,沒有被其他人所繼續,但是,他為後來的經濟計量研究提供了一定的基礎,並且為制度經濟學家的分析奠定了基礎。

韋斯利·克萊爾·米切爾:非正統經驗論者

早期制度主義者之一韋斯利·克萊爾·米切爾在宏觀經濟學的經驗研究問題上,與正統新古典經濟學家有重大不同。穆爾的研究提供了一種有益的焦點,我們能夠從中考察米切爾的經驗研究方法,這種方法在20世紀上半葉得到發展,並且是全國經濟研究局(NBER)最初採用的方法。穆爾比較形式化的統計方法存在著問題,這是米切爾的方法獲得偏愛的原因之一。

米切爾關於理論與實際分析之間適當關係的觀點,在他關於經濟周期的早期研究中就表達出來了:

致力於了解當今經濟活動周期性盛衰特徵的人,會發現對於經濟周期的眾多解釋既是啟發性的,也是令人困惑的。所有的解釋都似是而非,但是,哪一種是有效的?沒有任何一種解釋必定排斥所有其他解釋,但是,哪一種是最重要的?每種解釋都可以說明某種現象;任何一種解釋都能說明所有的現象嗎?這些相互競爭的解釋,能夠以某種方式結合起來,產生一種一致的且完全充分的理論嗎?

通過證明理論並批評理論這種邏輯過程來得到這些問題的答案,似乎僅存渺茫的希望。因為無論這些理論可能擁有怎樣的獨創性與一致性優點,如果它們未就經濟周期現象提出敏銳的見解,它們就都只有微小的價值。正是通過研究它們聲稱要加以解釋的事實來使理論得到檢驗。

但是,如果我們開始通過收集證據,依次檢驗每種理論來確認或者否認它,就會擾亂研究視角。問題的要點不在於任何經濟學家觀點的有效性,而在於對事實的清楚理解。對繁榮、危機以及蕭條現象的觀察、分析、系統化是首要的任務。如果我們直接著手於這一任務,與我們考察理論現象這一迂迴方式相比,會有更好的貢獻。

直接著手於事實的這一計劃,決不排除對其他人所得出結論的自由利用。相反,他們的結論表明應當尋找某些事實,應當進行某些分析,應當嘗試某些安排。的確,如果我們不從各個方面尋求幫助,整個研究將是粗糙和膚淺的。但是,我們希望的是將一種新的考察變成事實。

米切爾的方法注重實效;它並不把對理論進行實際檢驗這一重要作用看做是一種有用背景,而是把理論看做是解釋經驗觀察的一種有用背景。與這一觀點相符,米切爾並不將經濟學看做是一門科學,而是看做有助於政策形成的一門藝術。最終,對於米切爾來說,並不存在能在一個優雅的模型中被詳細說明的不變理論;經濟體過於複雜並且正在經歷不斷的結構變化。考慮到這種複雜的變化,創造一般理論就是在敷衍塞責;唯一可接受的理論是所傳授的常識,只有通過將常識與統計分析有機地綜合,才能理解經濟體。

儘管就形式上的科學性而言,數據並不適合於檢驗理論,然而,它們適合檢驗有關周期行為的不同假設。在後來的《測算經濟周期》(Measuring Business Cycles,伯恩斯與米切爾,1946)中,米切爾檢驗了熊彼特關於不同周期之間關係的假設,並否定了這種關係。他也檢驗了他自己的假設,即周期性行為中存在一種長期的世俗變化,他和合作者也否定了這一假設。他們確實發現了變化,但是,這些變化是不規則和任意的。因此,通過將形式上的統計檢驗——例如相關性檢驗與顯著性的檢驗——與基於制度知識與數據知識的判斷相結合,它們能夠非形式化地「檢驗」假設。儘管在科學方法中,形式化的檢驗決定了一種理論的有效性或虛假性,但對於米切爾來說,這樣的檢驗僅僅是對常識與主觀判斷的一種輔助。20世紀30年代期間,米切爾的數據與經濟經驗分析方法,為美國的主流實觀經濟學家所運用。

度量與數據收集

一些數據例如煤炭價格,能被簡單地加以收集和運用。適合理論結構的數據通常必須被加以構建。必須確定可以計量的概念,然後收集數據。這項工作通常是困難且苟求的。我們來看一些例子。

經濟學家運用價格總水平的概念,但是經濟體中並不存在對所有價格的度量。20世紀40年代以來,價格總水平的提高(通貨膨脹)獲得了大量關注。在通貨膨脹能被度量之前,關於價格總水平度量的構建已經進行了相當多的研究。在《指數的編製》(The Making of Index Numbers,1922)中,歐文·費雪考察了打算用來度量價格與經濟活動的指數在構建過程中遇到的一些問題。寄希望於通過取消中間產品,並適當地賦權重於最終產品,人們就能構建一種度量價格總水平變化的指數。藉助於這種度量,有可能為通貨膨脹概念增加更多的準確性,並檢驗有關貨幣供給變化與價格變化之間關係的假設。應當注意到,貨幣供給並不是作為簡單的數據存在並被加以收集和分析的,必須構建對貨幣供給的度量。很多經濟學家將其生命中的大部分時間花在度量與數據收集領域的研究上。

一些經濟學家在國民收入核算領域做出了重要貢獻。凱恩斯理論迫切需要對國民收入、消費、支出、儲蓄以及投資支出進行度量。在進行數據收集的量化研究之前,這些宏觀理論上的概念要求解決極其困難的概念性問題。理查德·斯通爵士(Sir Richard Stone,1913–1991)與詹姆士·米德(James Meade,1907–1995)都是諾貝爾經濟學獎獲得者,他們為英國發展了適合凱恩斯理論模式的國民收入核算體系。

在美國,國民收入核算的研究者是諾貝爾獎得主西蒙·庫茲涅次,他在米切爾的指導下創作了博士論文,並繼續在米切爾的指導下在全國經濟研究局進行研究。庫茲涅茨的主要貢獻是為美國構建了國民收入度量,並且運用統計學來度量和比較不同國家的增長模式。庫茲涅芯幫助創立的國民收入核算,是後凱恩斯宏觀經濟計量模型的一個重要組成部分。

華西里·列昂惕夫也是諾貝爾經濟學獎獲得者,他在組織數據收集過程中發揮了作用;他設計了投入產出分析,這是一種用來處理經濟體相互關係的實用計劃工具。列昂惕夫強烈地不滿於毫無經驗內容的現代主流經濟模型構建。他提倡關注經濟學的實際應用,運用數據進行研究而不是構建複雜的數學模型。他的論文《理論假設與不可測的現實》(Theoretical Assumptions and Nonobserved Facts,1971),是對人們能夠感受到的脫離現實的模型構建最好的批評之一。

另外兩位對數據收集做出貢獻的經濟學家是艾布拉姆·伯格森(Abram Bergson,1914–)與亞歷山大·格申克龍(Alexander Gerschenkron,1904–1978)。伯格森是一位有才能的理論家,他在24歲還是一位研究生時,便創作了一篇福利經濟學方面的經典論文。他成為美國蘇聯問題方面的主要專家,就前蘇聯經濟活動的度量進行了開創性的研究。在蘇聯解體之前,人們經常聽說蘇聯的計劃者採用產生於美國的對蘇聯經濟活動的度量,原因在於,這些度量比他們自己的統計更可靠。在將哈佛大學俄羅斯中心建成研究蘇聯社會的重要研究中心的過程中,伯格森起了主要作用。

像庫茲涅茨一樣,格申克龍出生在俄國,但20世紀20年代期間他在維也納接受經濟訓練。他是庫茲涅艾與伯格森在哈佛的同事。儘管他的書面作品數量不多,但是,他是教授中的教授,他掌握多種語言,針對帕斯捷爾納克(Pasternak),以及納巴科夫(Nabokov)對普希金(Pushkin)《尤金·奧涅金》(Eugene Onegin)的翻譯,發表了批評性文章。格申克龍對增長的度量,尤其是對蘇聯增長的度量進行了重要的研究,並且表明了工業生產指數中所使用的基年的選擇是如何影響指數所表示的增長率的。他的研究揭示出,蘇聯的增長並不像蘇聯計劃者所顯示的那樣快,原因是他們的度量有偏差。

經濟計量學的興起

20世紀60年代,米切爾的宏觀經濟經驗分析方法成為一種少數人使用的方法,受到微觀經濟學與宏觀經濟學中的經濟計量方法的排擠。很多理由解釋了為什麼主流不再依賴米切爾的方法而是轉向經濟計量學:(1)統計方法與經濟計量方法的進一步發展,使它們避免了穆爾研究中的一些問題;(2)經濟學專業和整個社會在完成並檢驗理論過程中,對準確性有強烈要求;(3)數理經濟學迅速發展,(4)經濟計量學使經濟學變成一門精密科學有了希望;(5)有才氣且意志堅強的經濟計量方法倡導者對這種方法進行著宣傳。

E. J·沃克因與確定問題

在微觀經濟學中推進經濟計量方法的一項發展是E. J·沃克因(E. J. Working,1900–1968)的確定問題方法。價格與數量之間的簡單相關性,即使提供了數據的「良好適合」也幾乎沒有什麼意義,原因在於,經濟理論規定價格與數量是由供給與需求的相互作用所決定的。人們見到過供給曲線與需求曲線的存在嗎?

沃克因表示,如果人們能夠獨立地說明供給,從而準確地了解供給關係以及它將如何變動,那麼,所得到的點將估計出一條需求曲線。也可以說,如果人們獨立地說明和需求關係,就能估計出一條供給曲線。如果人們不能獨立地說明任何一方,那麼,沒有額外的信息,就不能估計出供給曲線或者需求曲線。

確定問題的「解決」至少大體上使得從經驗上說明靜態關係成為可能,即使其他條件保持不變的條件不成立。人們相信,隨著計算技術的改進(通過計算機來實現),將會出現靜態理論與經驗理論和經驗度量之間的更好關係。

凱恩斯理論與宏觀經濟計量學

20世紀30年代,並不是微觀經濟學的發展從根本上向前推進了經濟計量學;而是宏觀經濟學的發展起了推動作用,因為這一時期是宏觀經濟計量學的發展時期。大蕭條將經濟學家的思想轉向宏觀經濟學。到了20世紀30年代後期,凱恩斯理論席捲經濟學領域,人們都在奮力為大蕭條提供令人滿意的解釋,政策也致力於解決大蕭條問題。因此,20世紀30年代直至60年代,經濟計量學的歷史集中於宏觀經濟計量學。

20世紀30年代,對宏觀經濟模型化的關注是符合邏輯的。這一時期,宏觀經濟學極大地受到凱恩斯宏觀經濟學的影響,人們嘗試著尋找凱恩斯理論經驗上的對應物,得出了很多對乘數的估計。科林·克拉克(Colin Clark)估計乘數介於1.5到2.1之間;米哈爾·卡萊斯基(Michal Kalecki)估計乘數約為2.25。

當然,只有當凱恩斯理論有意義時,乘數才有意義,所以,存在一種強烈的推動力,以從經驗上確定凱恩斯的理論是否正確。因此,出現了很多度量消費與收入之間的關係,即凱恩斯所謂的「消費函數」的嘗試。這一時期也出現了下列信念的缺失,即經濟力量具有推動經濟體朝向充分就業的自動傾向,與此相應,對中央計劃的關注也增強了。這種中央計劃要求對經濟體的關係做出估計。因此,重要的研究發生在像荷蘭中央計劃局這一類的學會中,就不足為奇了。

拉格納·弗里希·簡·丁伯根以及大型宏觀經濟計量模型的發展

挪威經濟學家拉格納·弗里希(Ragnar Frisch,1895–1973)是20世紀20年代末期和30年代早期最有影響力的經濟計量學家之一。弗里希是受過高度訓練的數學家,他既對宏觀經濟計量學也對微觀經濟計量學做出了貢獻,並且在使實驗經濟學改變方向、遠離制度方法、朝向經濟計量方法方面發揮了重要的作用。實際上,正是他創造了經濟計量學(econometrics)這一術語。儘管弗里希在微觀經濟計量學中取得了一些重大發現(他完成了一項具有決定性的對沃克因確定問題的數學處理,並且表明普通最小二乘估計是有偏差的),然而,正是他對宏觀經濟計量學的貢獻才表明了他的重要性。他與簡·丁伯根一道,在通過發展經濟體的一種宏觀經濟計量模型來創建宏觀經濟計量學中扮演了重要的角色。在弗里希的著作《運用完全回歸系統的統計合流分析》(Statistical Confluence Analysis by Means of Commplete Regression Systems,1934)中能夠看到他的主要研究。他在書中主張,大多數的經濟變數同時在「匯合的系統」中相互連接,在該系統中,沒有任何一個變數能夠單獨變化;他設計出了多種方法來處理這些問題。

簡·丁伯根是弗里希的朋友,1936年受國際聯盟招募,承擔對商業周期理論的統計檢驗工作。1939年他的報告《商業循環理論的統計檢驗》(Statistical Testing of Business Cycle Theories)得以出版。這一著作集中於根據數據發展動態宏觀經濟理論,並對它們進行檢驗。丁伯根發展了一種展示周期性趨勢的商業循環理論或宏觀經濟模型。

諸如弗里希與丁伯根一類的經濟計量學家認識到,宏觀經濟學中的經濟計量研究,與微觀經濟學中的經濟計量研究相比,在概念上要難得多。在微觀經濟學中,人們困擾於供給方程與需求方程這兩個單獨的結構方程的確定問題;在宏觀經濟學中,理論表明存在一個大的相關方程體系,該體系構成了宏觀經濟力量的基礎。不知什麼緣故,研究者幾乎無限地擴展對大量方程的微觀經濟分析,詳細地說明結構方程體系,並檢驗那些方程。

弗里希與丁伯根正是將他們的分析轉向這一任務,兩人因他們的貢獻而獲得了諾貝爾經濟學獎。像穆爾一樣,他們的目的不僅僅是簡單地檢驗一種理論的有效性:他們對政策感興趣。他們認為,如果他們能夠說明對經濟體進行描述的結構性方程組,那麼就能確定一系列的政策來改變那些方程的結構,並通過那些政策實現經濟體合意的目標。

丁伯根的研究引起了嚴肅的批評,批評來自約翰·梅納德·凱恩斯與米爾頓·弗里德曼,兩人都反對研究的整個過程以及從研究中得出的含義。他們認為,丁伯根的估計程序是,運用相同的數據得出用來檢驗可能相互衝突的理論的模型,這使得統計顯著性的正常檢驗不相關。他們的觀點代表了經濟計量學不能代替所傳授的常識這一堅定看法。即使在其最初階段,宏觀經濟計量學也受到了重大質疑。

特里夫·哈維默與經濟計量學中的或然說革命

特里夫·哈維默(Trygve Haavelmo,1911–)是一位挪威經濟學家,他與拉格納·弗里希一同從事研究,他因為將概率方法引入經濟計量學與經濟理論中而獲得讚譽。在引入概率方法之前,經濟學家假定他們正在試圖度量的基礎經濟理論是精確的。如果人們能夠在事實上保持其他任何事物不變,那麼,就能獲得一種精確的關係。哈維默反對這一假設,他主張應當將經濟理論視為概率理論,不是描述精確的關係,而是描述概率關係。

在哈維默的論文《經濟計量學概率方法》(1944)發表之前(但該論文1941年之前就以手稿的形式廣為傳播),經濟計量學家已經使用統計方法,但或含蓄或明確地認為,概率理論基本上沒有提供什麼東西,他們正在試圖探尋的基礎性法則是精確的法則。哈維默認為,因為概率理論是統計方法背後的理論實體,所以,如果不承認人們正在尋求或然性法則,卻運用統計方法,這是不合適的。對經濟法則或然性特徵的接受,使得很多統計方法與檢驗被正式加以利用,在此之前,這些方法與檢驗在被使用時並沒有正式基礎,這也使得它處於經濟計量學現代方法的中心。哈維默於1989年獲得諾貝爾經濟學獎。

考利斯委員會與考利斯委員會方法

哈維默的概率方法得到了考利斯經濟學人研究委員會研究者的認同,該委員會由阿爾弗雷德·考利斯三世於1932年組建,他是一位富有的投資顧問。考利斯集合了一群非常有智慧的經濟學家,包括歐文·費雪、哈羅德·霍特林(1895–1973)以及拉格納·弗里希,並要求他們研究如何將數學和統計方法應用於經濟問題研究。考利斯委員會最初位於美國科羅拉多州的斯普林斯;1937年遷到芝加哥並一直在那裡,直到20世紀50年代搬到現在的地點耶魯大學。

大多數現在被視為標準經濟計量研究的東西,都是由考利斯委員會從事的。這一研究包括評估普通最小二乘估計是否向下偏倚(它被發現向下偏倚百分之二十五);在小數據組中發展蒙特卡洛方法。研究漸近收斂和評估者的無偏移問題。

我們應當還記得,這一時期計算上的難度是極大的,因為我們今天所了解的計算機並不存在。人們不能簡單地向計算機輸入「得出OLS估計」或者「得出最大似然估計」命令來獲得結果。人們手工從事研究。考利斯委員會遵循哈維默的思想,假設最好的經濟計量學方法是概率方法,在這一方法中,結構方程有一個假定的誤差項分布。這種概率方法以考利斯委員會方法而變得為人所知。來自於考利斯委員會的最著名的經濟計量模型之一是克萊因–哥德伯格宏觀經濟計量模型,它是寬泛的凱恩斯體系最早的經驗研究代表,和包括63個變數,其中很多是內生的,有43個是前定變數。在這43個前定變數中,19個是外生的,24個是滯後的。

計量歷史學與羅伯特·W·福格爾

2定量方法發展中一個引人注意且有所爭議的分支是將經濟計量學應用於歷史分析。這一新的領域被稱為新定量歷史或者計量歷史學(cliometrics,在希臘神話中clio是歷史女神緣斯)。最為突出的新歷史學家是羅伯特·W·福格爾(Robert W. Fogel,1926–),他在1964年出版了《鐵路和美國經濟增長計量經濟史學文集》。在這一研究中,福格爾結會了新古典經濟學與統計推論,並對很多結論產生懷疑這些結論是從事文字創作的歷史學家,根據他們對鐵路與美國經濟增長之間的關係的研究得出的。

一些經濟學家開始實踐計量歷史學,併產生了大量文獻。同時也有大量關於新方法正確性的論述。A. H·康拉德(A. H. Conrad)與J. R.梅耶(J. R. Meyer)1958年發表了一篇引起爭議的文章—— 「南北戰爭前的南方奴隸制經濟學」,在文章中,他們否定了如隸制不是一種有利可圖的制度的結論。福格爾與S. L·恩格曼出版了《十字架上的歲月;美國黑人奴妹制經濟學》,他們在文中運用大量數據和研究,接受並擴展了康拉德-邁耶的論題。新古典經濟學與經濟計量學在歷史中的這一新應用,在歷史學領域內部產生了相當多的爭議,這是經濟學侵蝕其他學科的又一個例子。

宏觀經濟計量學科學優雅性的衰落

20世紀60年代期間,很多凱恩斯式的宏觀經濟計量模型得到發展,全都呈現出某種科學面目,這其中包括數據研究學會(DRI)模型、沃頓模型以及各種聯邦儲備模型。作為經濟體的預言者,這些宏觀模型一直流行至20世紀70年代早期,但是,到了70年代中期這項研究失去了支持。在羅伊·愛潑斯坦(Roy Espstein)對這些模型的論述中,他寫道:

進入20世紀70年代,實用經濟計量學家的自信並沒有持續很久。十年的經濟震蕩開始使得根據大量結構性宏觀模型做出的預測無效,這促使研究者對其體系進行不斷的重新說明和重新估計。伴隨這項工作的是日益增多的研究,這些研究將大模型的預測質量與新一代單變數時間序列簡單模型進行比較。這些比較也經常表明,結構模型做出的預測並不比簡單模型好,弗里德曼1949年做出的預測是一個明顯的證實。

對宏觀經濟計量模型的批評,其原因與經濟學家反對早期研究的原因類似。第一,古典統計檢驗的有效性取決於獨立發展的數據理論。然而在現實中,大多數以經驗為根據的經濟研究者「採集數據」,尋找「最佳的適合」——實現了最佳 r2、t 以及 F 統計量(度量理論正確性的統計量)的理論闡述。數據採集侵蝕了統計檢驗的有效性。第二,即使適當地實行了統計檢驗,數據的有限可得性也使得指派代理人成為必然,這種指派可能合適也可能不合適。因此,檢驗的有效性取決於代理人的適當性,但是,並不存在對代理人適當性的統計度量。第三,幾乎所有的經濟理論都包括一些不可度量的變數,這些變數能夠被指望著,而且經常被指望著解釋不符合理論的統計結果。第四,經濟計量檢驗的複製通常是不可行的,原因是經濟學家很少〈(即使曾經)能夠進行可控制的字驗。這使得任何結果的可靠性都是未知的,它依賴於主觀判斷。

羅伯特·索洛是一位宏觀經濟學家,獲得過諾貝爾經濟學獎,他捕捉到了經濟學專業對形式上的宏觀經濟計量模型的大量關注,他寫道:

我認為,不可能通過經濟計量來解決這些爭議。我認為,經濟計量學並不是一種相當有力和有用的宏觀經濟時間序列工具。因此,人們被迫就經濟休的結構做出判斷。雖然你總是能夠提供模型,運用經濟計量來支持你的觀點,但是,對於雙方來說這太容易了。人們從來沒有能力找到共同的經驗依據。

對經濟計量檢驗的冷嘲熱諷,使得很多研究者對其統計研究採取了一種隨便的態度。結果是很多研究不能被重複,極少的研究能被加以複製,在已發表的經驗研究文章中出現錯誤是平常事。愛德華·里莫(Edward Leamer)是加州大學洛杉磯分校的一位經濟計量學家,他總結了這一現象。他寫道:

經濟計量建模是在建築物的地下室完成的,而經濟計量理論課程則是在頂樓(第三層)講授的。我為同一種語言在兩個地方使用這一事實所困惑。更加令人驚異的是個別人的變形,他們在地下室中恣意地犯錯,隨著他們上到第三層,就變成了最高主教。

他指出,擺脫進退兩難局面的一種方式是運用貝葉斯經濟計量學,基中,研究者的信仰程度被考慮進統計檢驗中;但是,這樣做過程太複雜,所以大多數研究者只是不斷地在做他們常做的事情。正是經驗檢驗的這一難點,使得我們在第1章附錄中描述的修辭方法和社會科學方法大量出現。

對宏觀經濟計量模型的現代批評

2

一項獲得大量支持的對宏觀經濟計量模型的批評,被稱作盧卡斯批評,因為它是由羅伯特·盧卡斯提出的,盧卡斯是一位宏觀經濟學家,他是新興古典宏觀經濟革命的領導者。盧卡斯認為,個人的行為取決於預期的政策;因此,隨著一項政策變得過時,模型的結構將發生變化。但是,如果模型的基本結構發生改變,那麼,適當的政策也將改變,模型也就不再合適了。所以,運用經濟計量模型來預測未來政策的效應是不合適的。

其他現代宏觀經濟計量模型的現代批評家包括大衛·亨德里(Daivd Hendry),他認為,宏觀經濟計量學家應當運用最新的方法和大量的檢驗來使數據適合;也就是說,所揭示的統計關係應當優先於理論。第三位批評家是克里斯多佛·西門斯(Christopher Sims),他的觀點與亨德里的觀點略微相似。他聲稱,當今的方法施加給數據過多的理論結構,不施加結構會更好,應當在本質上將所有的變數都視為內生的,並運用統計方法來揭示關係。他贊成運用向量自回歸,或者自回歸移動和平均模型一類的方法。這些方法簡單地採用人們提交的所有數字,沒有結構,如果時間結構關係持續,再找到這些數字在未來的最佳估計。只有計算機了解這一基本結構。

向量自回歸方法是米切爾方法的現代化身,它用最少的理論關注於數據。傳統的宏觀經濟計量學家指出,這些新方法沒有運用任何對經濟體的理論見解。和較早的經濟計量理論批評家一樣,向量自回歸提倡者回應說,傳統的宏觀經濟計量模型與結構模型,是以非常有限的理論為基礎的,以至於沒有理論會更好些。

盧卡斯之前的經濟學家擁有很多見識,他們清楚這些問題。20世紀40年代後期,考利斯委員會也討論過,在雅各布·馬爾沙克(Jacob Marschak,1898–1977)、庫普曼斯(Koopmans)以及威廉·菲利普斯(Alban William H. Phillips,1914–1975)20世紀50年代至60年代的研究中能夠找到這一討論。然而,這一批評的影響來自於盧卡斯的研究。

貝葉斯經濟計量學

貝葉斯方法是對統計學含義另一種根本不同的解釋。與客觀解釋相對,它提出了一種對統計學的主觀解釋。貝葉斯們提出放棄古典解釋,從而放棄傳統的古典經濟計量學。不必說,就貝葉斯方法與古典方法而言,統計學家們之間存在著重大爭議。要理解圍繞經濟計量檢驗的很多混淆,理解兩種方法之間的差異是關鍵性的。

為了了解這一差別,假定我們希望估計某一參數的值。在古典統計學中,人們得到參數的點估計,它滿足某些特徵,例如BLUE標準,其中,B為best(最佳),,L為linear(線性),U為unbiased(無偏),E為estimator(估計)。此外,它必須具有合意的漸進性,使得當可以利用大量數據時,估計也會聚合到參數的真值上。古典分析的整個聚焦點在估計量和表明其特徵的統計學上。

在貝葉斯方法中,對估計量的解釋完全不同。貝葉斯分析不是產生數據的點估計,而是形成數據的密度函數,它被稱作後驗密度函數。密度函數並不是一種樣本分布。它只能藉助於人們先前所確信的東西加以解釋。當就數據的真值進行預言時,它通常是作為研究者給出的幾率被予以論述的。它是關於可能性的主觀概念,而不像在古典方法中那樣,是關於可能性的客觀概念或頻率論者概念。

因此在貝葉斯方法中,人們必須說明其初始的信仰程度,並運用經驗證據作為改變信仰程度的手段。人們既有一種先驗密度函數,也有一種後驗密度函數。在貝葉斯分析中,人們只是簡單地運用經驗數據來修正其先前的信仰,而在古典方法中,人們則不斷地試圖確立模型的真正性質。

經濟學家在很大程度上沒有使用貝葉斯方法。其原因並不在於他們反對主觀主義可能性的基本哲學特性;取而代之的是很實際的原因:(1)難以將先前的信仰形式化為一種形式上的分布,(2)難以發現後驗分布的過程;(3)難以使其他人確信貝葉斯結果的有效性,原因是它們明確地受到干擾,或者只能通過個人信仰得到解釋。儘管存在這些實際問題,很多經濟計量學家仍然真誠地熱衷於貝葉斯經濟計量學。

貝葉斯方法沒有引人注意地流行開來,但是,關於經濟計量課程中所講授的內容如何很少真實地反映了經濟計量學家所做的事情,一直存在著眾多的抱怨。例如,尹瑞里蓋特(Intriligator)、博多金(Bodkin)以及程肖(Hsiao)寫道:

現有的大多數經濟計量學教科書中,至少80%的材料單純集中在經濟方法上。與之相反,應用型的經濟計量學家,典型地只花20%其至更少的時間和精力在經濟計量方法本身上;剩餘的時間和精力花在研究的其他方面,尤其是花在相關經濟計量模型的構建、估計進行之前適當數據的開發,以及估計進行之後結果的解釋上。

造成這一差異的原因是,講授經濟計量學的教授通常並不是實際進行經濟計量學研究的人。正如馬格納斯(Magnus)與摩根(Morgan)在1999年所強調的,應在實幹中,而非教育中進行實際經濟計量研究。這些抱怨是下會導致未來更好的經驗研究,還有待觀察。

實驗經濟學家與模擬

最近,一群經濟學家開始在經濟學中採取一種不同的經驗研究方法。利用動物或者人擔當一種不知名商品的購買者和銷售者,在了解基本的供給與需求條件的前提下,來確定理論是否正確地預測了實驗中出現的結果。這些實驗經濟學家宣稱,通過他們的實驗,已經證明了不同的經濟命題。

我們來考察他們運用一種稱作「雙重口頭拍賣市場」的程序所進行的檢驗,其中,購買者與銷售者公開宣布競價並出價。弗農·史密斯是這一研究的領導者和發展者,他於1956年進行了實驗室實驗來檢驗雙重口頭拍賣市場是否能夠實現均衡。學生們承擔了供給者與需求者的角色,並喊出他們的價格。各方都有由十四個學生組成的市場,在十五分鐘內價格非常接近於均衡價格;一旦價格到達均衡價格位置時就傾向於停留在那裡。當需求變動(給學生幾張紙,告訴他們不同的需求條件)時,價格相對迅速地調整到新的均衡價格上。這一實驗被很多其他經濟學家所複製。

這種方法具有多種可能的用處。通過運用實驗方法,經濟學家就能了解市場是如何在不同的制度條件下發揮作用的。在最近的一次實驗中,研究者檢驗了有牌價市場,並將它與雙重口頭拍賣市場進行比較。在牌價市場中,廠商與購買者在一定時期內展示價格並堅持這一價格。研究者發現,與雙重口頭拍賣市場相比,在牌價市場上價格傾向於較高,這一發現使得美國交通部向實驗經濟學家尋求幫助,以解決涉及鐵路與駁船定價的問題。鐵路方面要求交通部將私人磋商的運費率轉變為公開展示的費率,認為公開展示將保護它們以及小駁船所有者免受大駁船所有者未公開的削價侵害。然而,當實驗者模擬這兩種類型的市場時,他們發現情況恰好相反:價格展示比私人磋商更傾向於產生較高的價格,並傷害小駁船經營者。鐵路因此放棄了它們的要求。

實驗經濟學家所進行的另一項檢驗是有關科斯定理的,科斯定理表明能夠相互損害但又進行談判的各方將進行討價還價,從而得到一個有效率的結果,無論哪一方有造成損害的法律權利。實驗的結果證明了這一預言。然而實驗發現,當通過擲硬幣賦予個人法律上的權利時,他們幾乎都不可避免地未獲得博弈論所預測的議價剩餘中全部的個人合理份額。取而代之的是,討價還價者們幾乎不可避免地平等地分享了剩餘。這表明支配分配的是一種公平的道德規範,而不是純理性的個人最大化。實驗進而表明,如果任意賦予不對稱的財產權,那麼,個人並不認為它們是合法的。然而,實驗者注意到,當財產權被賦予給實驗前在技能遊戲中獲勝的個人時,三分之二擁有財產權的個人獲得了大部分的共同剩餘,而在任意分配的情況下,沒有人獲得。

考慮到經驗檢驗理論中存在的問題,這一研究獲得重視並不令人感到奇怪。它的專業認同具有寬泛的含義,不僅要求經濟學家的訓練發生重大的變化,而且要求他們在社會中的作用,以及他們處理經濟問題的整個方法發生重大的變化。

一項相關的發展是通過模擬進行分析的。在這項研究中,模型被設計為具有多個代理人,他們遵循著簡單的地方化規則,然後進行模擬,並確定哪些規則能夠存在,哪些不能。這使得建模者藉助假設的繼續存在來選擇假設,而不是藉助內省。

總結

很難評價經濟計量學最近的發展。它的歷史是末實現的希望和預期的歷史。這些無法實現的希望和預期,在宏觀經濟計量學中比在微觀經濟計量學中要多得多。然而,應當提醒讀者,我們對於宏觀經濟計量模型構建現代歷史的看法,可能過於悲觀。構建了這些模型的人認為已經取得了進步,例如勞倫斯·克萊因及其同事斷定:

我們發現,在半個多世紀的宏觀經濟建模過程中,很多引人注意的教訓已經被吸取。當然,這並不意味著宏觀經濟建模的進步是直線的,或者其至是單調的或連續的。出現了一些人退步,如果有後見之明,很多事情本可以按照不同的方式去做。但是,已經取得了進步,並且我們認為,我們對現實世界宏觀經濟的了解,與半個世紀前相比要多得多。

也這一觀點有可能是主流觀點,但不是我們的觀點。它也不是傳統宏觀經濟計量學批評家們的觀點,他們認為:(1)主流的結構模型並沒有弄清楚正在估計和正在檢驗的是什麼;(2)與合理的數量相比,模型提倡者所要求的數量過多了。批評家們所質疑的並不是經驗研究;而是經驗研究的適當種類。抨擊來自於兩個方面。制度主義者希望將更多的注意力放在定性數據上。一些人希望通過計算機來研究未受到理論阻礙的數據。還有一些人希望看到比當前所使用的檢驗還要複雜的檢驗。

因為微觀經濟計量學集中於局部均衡問題,所以,它所呈現的是不太嚴重的方法問題。不過,它也存在問題,也有批評者。具體來說,批評者指責說,即使是微觀經濟計量學,也需要經濟學中難以獲得的信息,並且,沒有可控制的實驗,古典統計檢驗就不能表明它們自認為已表明的東西。至於宏觀經濟計量學,批評者採取兩種完全不同的主張制度主義者聲稱,經濟學家應當更多地關注被傳授的通常經驗論,它較好地結合了制度知識與歷史知識,貝葉斯的批評者則認為,我們需要更多的技術上的檢驗,它們抓住了統計的主觀特性。

愛潑斯坦在他對經濟計量學史的研究中,掌握了很多批評者對經濟計量學近來發展的看法,我們用他的這段話來作為本章的結束語。

在沒有可控制的實驗或者得自於統一而穩定的人口大樣本的幫助下,立志於更大的定量準確性,就這一點而言,經濟計量學在所有學科中可能是獨一無二的。迄今為止經驗表明,即使是最大的模型也具有精確而單純的結構,這些結構所代表的實際現象的有效性非常之低美國制度主義者的研究項目…… 與之相反的是在定量上不精確,但強調經濟結構的一種複雜的、分解的、歷史的方法。當所要處理的問題相當特殊時,他們的政策最為成功,並且允許以「從實踐中學習」的形式進行實驗,例如,失業保險計劃的設計,勞動仲裁委員會的實行,或者配給項目的管理。一個更加關鍵的因素,是對受到這些措施影響的不同經濟群體的不同情況與動機的詳細了解。與之相反,溫寧(Vining,1949)的觀測具有一定的合理性,即經濟計量學家似乎完全關注於「整個文明的病理學」。這一研究表明,很多經濟計量模型的不精確,是對經濟現象極為單純化解釋不可避免的結果。經濟計量分析在一種制度約束與個人行為能夠更加清楚地加以辨別的新的層面上進行,可能是最富有成效的。

  1. 經濟波動由太陽黑子引起的思想具有某種幽默光環。較早由穆勒提出的另外一種解釋與「商業情緒」的改變有關,記住這一點很重要。為什麼情緒會改變,或者為什麼這種改變似乎存在某種規律,關於這些,並沒有任何解釋。考慮到這一點,對內生周期感興趣的經濟學家,就自然地轉向諸如太陽黑子一類的自然現象。關於傑文斯太陽黑子研究的一篇優秀論文,參見桑德拉·J·皮爾特的《太陽黑子與預期》:威廉·斯坦利·傑文斯的經濟波動理論」一文,該文載於《經濟思想史雜誌》1991年秋第2期第24–265頁。?

推薦閱讀:

相关文章