什麼才是心理學的學科基礎?
《心理學報》2019年9期刊文:《「操作性定義」和「證偽標準」不足以為心理學奠基》
「操作性定義」和「證偽標準」不足以為心理學奠基?mp.weixin.qq.com相信這兩點是每位教授心理學的老師都會強調的
《心理學報》的這篇文章主要是在反對斯坦諾維奇在《How to think straight about psychology》(中文第7版譯名《與「眾」不同的心理學》,第8版譯名《對偽心理學說不》,第10版譯名《這才是心理學》)中提出的一個被文章作者稱為「方法論中心」的觀點。作為一個讀斯塔諾維奇這本書入門的心理學生,在看到這篇文章時會有點抵觸。但還是盡量客觀地說一點個人的見解。
首先,斯坦諾維奇說了什麼?在書中,其表達的觀點是心理學有著令人驚嘆的廣泛性,APA有50多個分支機構,各分支本身又都是寬泛的研究領域,認知、社會、人格、臨床、發展、教育、工業組織等等分別關注著不同方面、不同情境下的心理與行為,理論難以整合。要在內容上把各研究課題聯繫起來,則會產生一個類似「都關注人類行為」的概括,但又無法將心理學與經濟學、文學、社會學、人類學、哲學區分開來。斯坦科維奇認為將心理學各個分支聯繫在一起的,是共有的基於實證主義的科學方法,分別用這共有的科學方法來研究人的心理和行為的方方面面。
所以,斯坦諾維奇說「心理學不同於其他行為研究領域的地方在於,它試圖向公眾保證,心理學中有關行為的結論都有科學證據……」這其實是當前心理科學界的主流觀點:文學家、哲學家、各種思想家一直以來都對心理學關涉的「心理與行為」問題提出著自己的見解,而讓心理學成為一門獨特學科(科學)的,是其科學的方法,讓我們能確信結論是有依據的,是普遍的知識,而不是個人化的觀點。對當前主流的心理學者而言,強調實證的科學研究方法是為了能區分【心理學】和【非心理學】,只將有實證依據的科學心理學納入心理學的範疇,而諸如弗洛伊德等沒有實證依據的關於人的心理、行為的觀念則不納入心理學範疇,但並不是完全否定,只是把它和其他哲學、文學等等同看待。非心理學的知識不能作為普遍的事實,像科學結論一樣傳播,但對理解人性也可能有所助益,甚至對個人而言可能比科學更有助益。而【偽心理學】則是指以心理學的名義傳播非心理學,把沒有依據的觀點像有依據一樣傳播。
也就是說,斯坦諾維奇並不是說研究對象(心理與行為)不是心理學學科的核心要素,但只有內容是必要但不充分的;方法同樣是必要不充分的,但比內容更易於整合廣泛的心理學,並且與其他學科有更好的區分效度,所以斯坦科維奇更強調方法作為心理學的核心。
而舒老師這篇文章表達了這樣的觀點:1)內容應該比方法重要,目前基於實證主義的這些方法是非必要的;2)心理學既包括「科學心理學」,也包括「人文心理學」。
舒老師文章中想要實現的,是把一些當下被當成【非心理學】的,但確實和人的心理和行為有關的知識也納入【心理學】的範疇,立足於「本體論承諾」重新設計更好的研究方法,擺脫「照搬自然科學」的實證主義方法論。這是一個聽起來很好的願景,但卻並沒有給出什麼具體的出路。
文章中引用了一篇1999年的文章,來說「在心理學界, 越來越多的人開始關注『非科學心理學』」,對此我並不了解,不知道現狀如何。但據我所知,近幾年自心理學可重複性危機以來,心理學的學科自我反思的結果,是向著硬核科學更近了一步,大樣本、Open Science、探索性與驗證性分離等等,將使心理學更加嚴謹但「無聊」。
文章中給出的一個「出路」,是關注「人性」,將其與「物性」分開看待。這其中大概帶有一點作者自己的觀念輸出,畢竟關於意識、自由意志的討論都還沒有確定的科學結果。文章中強調「個體」是心理學研究中不可還原的基本單元,似乎是一種不把人「物化」的觀念上的關懷,但對人的研究本身可以還原到更微觀的層面,不知道作者是否對腦成像等研究心存不滿。文章中有一些對物理學的評論,我個人也不太贊同。
總之,舒老師與合作者的這篇文章發表在《學報》上,對心理學人自我反思來說無疑是好事。之所以要講「學科基礎」,是為了區分【心理學】和【非心理學】,作為心理學人,我們希望心理學能夠更好、更多地解釋人的心理、行為現象和原理,但目前基於實證的科學方法還沒有完全發揮,替代性的方法也還未出現,【以心理與行為作為研究對象】和【實證的科學方法】二者都不可或缺。
首先,反對兩種觀點:一、認為發在《心理學報》上的文章沒有價值;二、認為舒躍育、石瑩波、袁彥三位老師發文的「動機」是讓心理學回到哲學沉思,放棄科學方法,「用心險惡」。
針對第一種觀點,國內心理學期刊的質量相比於JEP,JPSE,Psychological Bulletin,Psychological Review,Psychological Science之類的國際知名心理學期刊的確是差一截的,但沒看過文章,光憑一個期刊名就妄下論斷,不是搞學術的態度。實際上,《心理學報》在國內心理學界也是很有名氣的,儘管在英文SCI和《心理學報》之間選擇的話,多數人可能會選擇英文SCI。針對第二種觀點,作者發文的動機只有自己知道,光看文章內容只能進行不準確的推測(文章內容不是作者說了算的,審稿人會教作者做人),並且原則上來說,動機不應該成為評判一種觀點合理不合理的依據。
下面說一下文章的具體內容。文章的主旨是論證「『操作性定義』和『證偽標準』不足以為心理學奠基」。「為心理學奠基」這個說法非常不常見,需要一些澄清。文章有一段直接說到了這個問題:
問題的關鍵在於, 這兩個標準是否足以為心理學奠基?或者換句話說, 心理學是否可以通過這兩個標準, 就能將學科內部的 「非科學成分」成功排除出去?這兩個標準能否成為評判心理學知識合法性的標準, 從而將心理學與偽心理學區分開來?(P3)
從第二個問句來看,作者的意思是「操作性定義」和「證偽標準」不能夠作為劃分心理學中「科學成分」和「非科學成分」的標準。從第三個問句來看,作者的意思是「操作性定義」和「證偽標準」不能作為劃分心理學和偽心理學的標準。這兩種意思是不等價的。第一種意思關注的是在關於心理的命題中,「操作性定義」和「證偽標準」能不能區分科學命題和非科學命題,或者說它們能不能作為科學和非科學的劃界標準。第二種意思關注的則是「操作性定義」和「證偽標準」能不能區分一個命題是不是心理學命題。區分這兩種「奠基」的解讀非常關鍵。在我看來,這一區分直接決定了文章的論證方式和結論是否合理。
文章的整體結構是這樣的:先介紹「操作性定義」和「證偽標準」在心理學科學化中的意義,再挑明它們的局限性,接著闡述心理學中存在科學成分和非科學成分,最後論證心理學作為獨立的科學有怎樣的理論基礎(研究對象有特殊性)。
心理學專業的學生或愛好者對「操作性定義」與「證偽標準」的含義和它們在心理學科學化中的意義應該比較熟悉,我就略過不談了。心理學專人的對科學哲學了解可能不多,因此說一下文章中對「操作性定義」和「證偽標準」局限的說明。針對「操作性定義」,作者列舉了兩個局限:
- 有些概念無法下操作性定義;
- 操作性定義和概念之間並不是一一對應的。
這兩個局限其實都很好理解。一些概念確實無法下一個操作性定義,比如作者提到的「心理學」。要對「心理學」下一個操作性定義,大概就是把做心理學研究的過程描述一遍,然後說這個過程和產生的結果就是心理學,但這樣的定義是無法令人認同的。心理學研究的過程可以有無數種變式,要窮舉它們是不可能的,而抽象說提出問題、收集數據、分析數據、得出結論,既沒有讓這個概念變得具體、精確,也沒有捕捉到人們對「心理學」這個概念的認識。另一方面,操作性定義和概念本身之間的差異也是不可忽略的。一個概念可以有若干種操作性定義方式,但它們指的是同一個東西嗎?例如,韋氏智力量表測出來的智力和斯坦福-比奈量表測出來的智力是同一個智力嗎?這兩個智力量表在操作上有所不同,按照操作性定義它爸爸Bridgman的看法,它們就是不同的概念,但通常的看法是它們是用不同的方式測量了同一個概念:智力。操作性定義有局限性其實不是什麼新觀點,亨普爾在《自然科學的哲學》中就指出過操作性定義的問題。有興趣的可以找來看看。
針對證偽標準,作者也指出了兩個局限:
- 可證偽性只是檢驗科學理論有效性的一種標準,而且還深受「迪昂-奎因論題」的困擾。
- 許多不可證偽的理論依然是有價值的。
「可證偽性不能作為科學和非科學的劃界標準」這一觀點在科學哲學界基本上是共識了。簡單說來就是,可證偽不是科學的充分條件。比如「按照瑪雅預言,2012年地球會毀滅」和「2015年人類會迎來第三次衝擊」都可證偽,而且已經被證偽,但不是科學命題。可證偽也不是科學的必要條件。比如「引力波存在」和「人的短時記憶容量有95%的可能性不超過10個組塊」是科學命題,但是不可證偽的。除此以外,單一的命題是無法推論出一個可檢驗的經驗預測的,而必須和其它命題組合在一起才可以得出一個可檢驗的預測,因此經驗觀察和理論預測相反不能說明我們想要檢驗的命題是錯誤的,只能說明那一連串命題合在一起是錯誤的。也就是說,任何單一命題都是不可證偽的。關於可證偽性的問題更全面、具體的論述,可以參考這個回答:
波普爾是如何論證「可證偽性」原則的?後人對這個命題如何反駁??www.zhihu.com通過對「操作性定義」與「證偽標準」局限的論述,作者其實已經證實了前面說的「為心理學奠基」的第一種意思的問題所在,即在關於心理的命題中,「操作性定義」和「證偽標準」因其自身的局限而不能區分科學命題和非科學命題。這樣的結論對於只看過實驗心理學教科書的人來說可能很震撼,但對於了解過一些科學哲學的人來說,它只是一個平凡的結論,是幾十年前就已經得到的結論。不過,這不意味著我們通常認為的「心理科學」不是科學。從具體的心理科學研究來看,「心理科學是科學」是沒有什麼爭議的,或者說不需要有什麼爭議。心理學科學化也是一個歷史的行程,基本不可逆,想逆流而上的心理學研究者活得都比較慘,至少比高實證的慘無數倍。從科學哲學的角度看的話,為科學劃界在現在多數的科學哲學家看來,也已經不再是一個那麼重要的問題——劃界問題「已經死了」。
在說明「操作性定義」和「證偽標準」的局限之後,作者又闡述了心理學中既存在科學成分,也存在非科學成分,即心理學除了經驗的方法和結果,也包括工程技術、數學、統計學、哲學假定等。這意味著,心理學中除了實證方法外,還有其它非實證的成分,而「操作性定義」和「證偽標準」對於心理學中的非實證成分不能提供任何有價值的信息。這裡其實區分了我之前說了「為心理學奠基」的兩種意思,「操作性定義」和「證偽標準」只對第一種意思有價值(但它們無法成為第一個意思上的心理學的基礎),對第二種意思則沒有任何價值。作者也意識到了「為心理學奠基」的兩種意思是不等價的。
那麼這樣就非常清楚了 , 為什麼說「操作性定義 」與 「證偽標準 」這兩個方法論無法為心理學奠基。這兩個方法論在「科學心理學」的範疇之內 , 對於將「科學」與「非科學」進行劃界, 具有重要意義。但並不能因為這個劃界, 就貶低「非科學」心理學的價值並將其視為「偽心理學」。換句話說, 對心理學知識的科學性的劃界, 不能等同於對心理學與偽心理學的劃界, 這個劃界標準不能作為判定心理學知識合法性的標準。(P7)
只要粗略想一想就可以知道,這兩種意思並不等價是很平常的。「科學和非科學的區分」與「心理學和非心理學的區分」完全是兩個不同的東西,除非科學和心理學完全等價。用來做第一個區分的標準自然不能用來做第二個區分,何況「操作性定義」和「證偽標準」壓根不能做第一個區分。退一步說,就算我們認可心理學和心理科學是等價的,並且「操作性定義」和「證偽標準」可以區分科學和非科學(這兩個說法自然都是有很大問題的),這兩個標準也只能區分科學和非科學,必須藉助額外的第三個標準判斷某個命題是否是關於心理的,才能夠判斷這一命題是心理學的,還是非心理學的。
不過,這也意味著,文章的主體內容缺乏實質性的信息,「區分科學的東西(本身還是錯的)不是區分心理學的東西」過於理所當然了。從文章的整體內容來看,我認為作者真正想要做的區分是心理學和非心理學,但標題上反映的卻更像是在區分科學(心理學)和非科學(心理學),內容上也有大半用來說「操作性定義」和「證偽標準」不能區分科學和非科學,有偏題的傾向。除此以外,文章中著重強調了「心理學分裂危機」,但我從未聽說過這個危機,日常中也從未聽到有老師提到過這個危機。說起心理學的危機,大家講的都是可重複性危機。如同某位答主說的,作者似乎是自己立了個不存在的靶子,然後瘋狂攻擊它。
如果暫時忽略上面提到的問題,但就如何區分心理學和非心理學這個問題來看,作者給出的回答有一定道理。作者認為區分心理學和非心理學,或者說心理學區別於其它學科的特性在於心理學有獨特的研究對象:人的行為和心理。當然,嚴格說來,心理學不只研究人,生理心理學經常以動物為研究對象。不過,一般的來說,心理學研究的是人的心理現象,而且就學科性質來看,這是心理學區別於神經科學、社會學等學科的最重要的特徵。心理學與其它學科之間存在很多的交叉。比如決策,心理學研究,神經科學研究,經濟學研究,政治學也研究。並且,在這些研究中,文章發的IF高的,多半是從生物學角度出發的,以發現某一個分子,某一個信號通路,某一個核團為主的研究。如果相同的研究主題其它學科也在研究,而且研究方法也是共享的(畢竟都是物理學那裡「抄來」的),那麼心理學作為一門有別於其它學科的獨立學科,其獨特的地方就只有它關注人真實的心理現象和心理過程,即關注的重點有別於其它的學科。
然而,如果考察真實的研究工作,大家可能根本不關心心理學有沒有獨特的研究對象,重要的是具體的研究問題、自己的知識背景以及自己已掌握的和能以較低成本掌握的研究技術,因為它們決定了我做的是或者能做的是什麼研究以及如果做這個研究。心理學是否有獨特的特性這個問題相對於需解決的一個具體的研究問題而言,並不那樣關鍵,甚至並不那樣有趣。心理學沒有特性,那又怎樣呢?它反映的是心理學研究工作者獨立意識不夠,心理學面臨分裂危機,還是人類太垃圾,無力一人攻克所有學術問題,從而只能分而治之呢?
一、竊以為評判「操作性定義」和「證偽」的文章應該首先對這兩個概念有明確對操作性定義和證偽標準 ;Stevens提出操作性定義的時候就指出,沒有清晰的操作性定義,心理學就會過於模糊,陷入無休止的爭論之中。
二、我們看看Stevens提出「操作性定義」的時候給出的基本原則:
1. Science is knowledge agreed upon by members of society. Only those constructs based upon operations which are public and repeatable are admitted to the body of science.
2. Psychology regards all observations, including those which a psychologist makes upon himself, as made upon the other one and thereby makes explicit the distinction between the experimenter and the thing observed. 3. Although a particular experimenter may himself be- come the object of study by another experimenter, at some stage of such a regress an independent experimenter must be assumed. 4. A term or proposition has meaning (denotes something) if, and only if, the criteria of its applicability or truth consist of concrete operations which can be performed. 5. Discrimination or differential response is the fundamental operation. It is prerequisite even to the operation of denoting or pointing to. 6. By discrimination we mean the concrete differential reactions of the living organism to environmental states, either internal or external. Discrimination is, therefore, a physical process, or series of natural events, and all knowledge is obtained, conveyed and verified by means of this process.簡單翻譯一下,就是:
1、大家認可的概念/構念(construct)是科學知識的基礎;
2、可觀察性;(可以理解為自己看到的和別人看到的必須是一樣的東西)
3、觀察的獨立性;(承第二點)
4、概念的意義取決於和現實的對應;
5、可區分性是前提;
6、區分指的是實實在在的區分;
以最近的科學雜誌上的誠信的文章為例
崇巍講堂:全球誠信排名?這篇文章到底說的是什麼?zhuanlan.zhihu.com這篇文章的題目講的是誠信:
1、誠信是一個普遍被接受的概念,但在內涵和外延上會有一定的區別。比如誠信有故意欺騙(commission)和知情不舉(ommision)這樣的區別,在有些文化里,大家把兩種都認為是欺騙,美國的法律也認可兩種都作為欺騙;但在有些文化里,很多人不認為第二種不是欺騙。這是很多人覺得這篇文章不能夠正確指出中國人在誠信方面的程度的原因。其實說白了就是我們中國人不覺得收了東西不找失主是沒有誠信;
雖然在細節上有差異,但是大家對誠信這個概念總體上是接受的,這就有了一個共同的基礎;
2、操作性定義的標準其實就是可以測量,測量的意思其實就是可以比較,有多少之分;
Stevens提出了所有的測量心理概念的方法,目前仍然廣為被心理學家採用。從最基本的層面來說,就是有多和少的區別。
測量誠信可以測量心理量,比如感到愧疚的程度;
誠信也可以用行為來測量,就是聯繫失主的百分比。
幾乎沒有什麼心理測量是百分百準確的,其實即使是物理學的測量也是有誤差的。但是,測量的本質是比較,也就是說,我們有信心聯繫失主的人比不聯繫的人更有誠信。這裡我用了信心這個詞,是因為心理測量的信度問題。比如挪威和瑞士的歸還率很接近,就不能斷然下結論瑞士更有誠信。但是從這個數據來看,瑞士更有誠信的機率高一點。數據相差越大,這個信心就越大。比如比較瑞士和美國,認為瑞士更有誠信的信心就大更多。
搞清楚了操作性定義,科學屆才能共同研究問題,才能積累數據,才能進步。沒有操作性定義,各執一詞,各有「特色」,就無法避免爭執不修;
三、關於科學認識論和證偽;
崇巍講堂:科學認識論:證偽、假設經驗和貝葉斯假設檢驗?zhuanlan.zhihu.com這裡面有介紹,我補充一點。證偽的確只是科學認識論中的一種,但是目前還沒有特別好的新的理論能夠完全替代。貝葉斯方法有這個能力和趨勢。科學認識論是在不斷完善和進步的。但是讓心理學拋棄「證偽「的話,必須能夠給出一個更好的替代方法。
參考文獻:
1、Stevens, S. S. (1935). The operational definition of psychological concepts. Psychological Review, 42(6), 517–527. https://doi.org/10.1037/h0056973
2、 Stevens, S. S. (1946). On the theory of scales of measurement. Science, 103, 677–680.
大致讀了一遍之後,我感覺有點擔憂(純屬個人意見,如果有不當之處,請各位多批評)。
在舒老師的文章中對「操縱化定義」和「可證偽標準」的批判我是支持的。但是在批判之後,立下的觀點可能間接地支持兩個"自我中心"的觀點,這是我比較擔憂的。
第一個是以心理學為中心,將心理學從其他科學中「割裂」開來,成為一個獨特「科學」。當然,文章中沒有很強的這種以心理學為中心的觀點,不過還是有些這種意味,認為心理學非常獨特。但是大家想想這種以本學科為中心的極端形式,就可以看到以某個學科為中心可能是不好的:以研究者自己所在學科為中心,建立學科之間鄙視鏈。我作為一個心理學的研究者,也沒有覺得心理學真的有那麼特殊,而是與其他學科一樣,為推進人類的知識而進行探索。許多心理學知識不一定是在心理學研究者中產生的。所以我覺得心理學應該突出與其他學科的共性,包括社會學、經濟學、人類學等社會科學,也可以包括生物、物理和化學等傳統的學科,也可以包括工程類的學科。
以心理學為中心的觀點基礎是因為我們研究對象的特殊性,這可能反映了我所擔心的第二個「自我中心」的觀點,即以人為中心,認為人與其他萬物有著本質的區別,不能使用同樣的方式進行研究(人性與物性的區分)。我非常贊同心理學研究(以及任何科學研究)應該有人文精神,但是這不能與科學本身混淆不清。以人為中心的極端形式可能是認為人性是神聖的、是不可知的。這種人類中心主義根植於整個人類文明的歷史,只有《人類簡史》這本書第一次試圖放棄人類中心的視角(可能是我讀書少,我是第一次在那本書里接觸到這種觀點),更好區分「是什麼(is)」與「應該怎麼做(ought)」。作為研究者本身是應該有人文關懷,但是研究時需要儘管克制人類中心主義,因為它可能會帶來偏見。
以上這兩種中心主義的觀點與台灣的「本土心理學「和「社會學的本土化」有著相似之處,後兩者認為自己的(東方的)文化/社會是獨特的、無法用(西方的)科學方法來進行研究的。但不管是哪種自我中心主義,都很可能會陷入到自娛自樂的封閉小圈子狀態,減少跨學科的交流,減少多樣化。
最後,我對教材中的「可操作化定義」和「可證偽標準」也是不滿的,但我覺得不是要走入心理學為中心和人類為中心的舒適區,而是:
第一、審視我們的操縱化定義是不是真的在操作化定義,審視心理學的中的概念和術語是否可靠、是否是相同地操作化、是否做到心理測量的基本要求,從我目前了解到的對心理學文獻的回顧來看,操作化定義不是太多,而不夠,術語使用混亂、測量也往往不夠嚴謹標準化(見下面我收集的幾個例子);在沒有進行更加嚴謹地進行操縱化定義和規範化地使用術語、測量和實驗之前,就否認實證方法的有用之處,有點操之過急;而且,心理學回不到哲學庇護之下的童年了;再而且,現在的方法不行不代表以後的方法不行。