哥廷根大學、哈佛大學、浙江大學、武漢協和醫院的中國研究人員一起,對聲稱去年8月武漢就有新冠疫情的哈佛論文的數據進行了重新分析,發現了哈佛團隊更多的學術不端行為,尤其是在停車場數據的非參擬合中為得到想要的結論刻意調整參數。

目前,哈佛原論文已被撤稿。

對哈佛論文的評議文章原文:Comment on 「Analysis of hospital traffic and search engine data in Wuhan China indicates early disease activity in the Fall of 2019" by Nsoesie et al.

相關討論:

如何看待哈佛大學一篇論文,利用衛星圖像和百度檢索數據推測新冠發生於 2019 年 8 月??

www.zhihu.com圖標


大家好,我是哈佛論文的批評文章的作者之一,受第一作者的委託發布下面這個回答。(作者已授權本文的署名轉載)

--

大家好,我是德國哥廷根大學應用與數值數學所的 陳浩 博士。我之前在知乎先後用過 @陳浩 和 @Dr How 兩個 ID,大概一兩年前註銷了賬號。

@冷哲 的答案中提到的對哈佛論文的批評文章,我是第一作者,與 William Ma 同為通訊作者,也是我們五人團隊的召集人。這個問題下面的許多回答對我們的工作多有或多或少的誤解,因此我們非常感謝知乎團隊和我們聯繫,讓我們有機會在知乎介紹一下我們的論文。

我是 2020 年 6 月 15 日產生寫這篇批評論文的想法。哈佛論文通過預印本+新聞通稿的形式,繞過同行評審推廣不靠譜的結果,在我看來是非常不道德的。我最初是想在 PubPeer 上發評論,結果發現哈佛論文沒有 DOI,因此沒有被 PubPeer 收錄。這讓我更加生氣。因此我想:既然你假裝自己是論文,我就以論文的標準對待你。一篇有問題的論文會被怎樣對待?會有許多同行寫文章批評,最終被迫撤稿,作者的學術聲譽也會產生永久的污點。所以我決定寫一篇批評文章,在學術文獻中留下記錄,成為哈佛團隊永遠的污點。

需要強調的是,我們並不試圖在新聞媒體中獲得比原文更高的關注和流行度。我們的目標是以學術圈的標準做法,對有問題的研究提出批評,並留下永久的記錄。

我自己是做數學的,為了保證學術上的嚴謹,我邀請了有統計背景的 William Ma 和來自浙江大學、哈佛大學、及武漢協和醫院的三位醫藥背景的學者。然後我們邀請了世界各地多位學者、記者、和熱心人士幫我們校對稿件,提出意見。最終我們在 7 月 3 日把批評文章放到我的個人主頁公開(鏈接:http://num.math.uni-goettingen.de/~hchen/documents/COVID19.pdf ),同時上傳哈佛大學的 DASH 平台,即原文所在的平台。

我們的文章發布後,我立即聯繫了幾位學術打假圈的名人,包括 Elisabeth Bik 和 Leonid Schneider。兩位都對我們的工作表達了肯定,並轉發我們的文章。Schneider 甚至呼籲 medRxiv 打破不收 commentary 的政策,破格收錄我們的批評(最後並沒有成)。

7 月 8 日,我們的文章被 DASH 平台收錄。與此同時,DASH 平台的管理員告知我們,原文的狀態已經從 accepted manuscript 更新為 authors original。這個更新有很多信息,但是到底意味著什麼,我們只能揣測。根據我們掌握的信息,原文作者確實已經投了期刊,但是應該並沒有被接收,所以當時剛看到 accepted manuscript 這個狀態時,我們就比較驚訝。後來的狀態更新,可能確實是投稿了,可能是之前誤報現在糾正,我們不知道。我們也不知道這個狀態更新是否與我們的批評文章有關。

值得一提的是,DASH 平台從一開始就非常支持我們,甚至加急處理了我們的投稿。這種不遮醜的態度非常值得敬佩。

接下來,我簡要說一下我們批評了哈佛論文哪些方面。哈佛論文在社交媒體上已經有許多批評,但是其中能達到學術論證標準的並不多。我們提出一項學術批評之前,都會儘力為對方辯護;如果能輕易辯護的,我們就不再花精力。這有時叫做 principle of charity(慈善原則),為的是做出最有效的反駁。

我們團隊中有人聯繫過作者,得知作者使用的搜索關鍵字是莫名其妙的「腹瀉的癥狀」。作者聲稱觀察到的搜索量上升,在「腹瀉」「拉肚子」「氣短」「呼吸困難」等更典型的搜索中,都沒有出現。這坐實作者犯了「采櫻桃謬誤」,即只彙報對結論有利的證據,隱瞞了其他證據。這種做法通常來說是灰色地帶,因為一般被隱瞞的證據都可以推脫給「儀器沒調好」之類的理由。但是哈佛團隊是在用互聯網,這種理由是不成立的。因此我們認為這是學術不端行為,也是我們批判的重點之一(Sec. 4)。

此外我們也提到了 ABC 新聞報道用圖的問題。但是根據慈善原則,我們對此沒有深究,只是建議原文作者澄清這些圖是不是他們提供的。另外還提到了作者選取湖北省婦幼保健院的謎之操作。以上這幾個論點是和社交媒體有重疊的;社交媒體中的其他批評,我們經審核後認為不夠強,決定棄之不用。

對於哈佛論文對停車場的分析,我們用軟體從他們的圖表中提取了數據,然後做了詳細的檢查,發現許多之前沒有人注意到的數據和統計方面的嚴重問題。下面是一些簡要的描述。

1、作者收集的數據少,質量低。29 個月的時間裡作者從六家醫院只收集了 140 個數據,平均每家醫院每個月都不到一個數據。其中 30 個數據點集中在最後兩個月。在前 27 個月,有三家醫院分別只貢獻了 7,8,10 個數據點,而莫名其妙的「湖北省婦幼保健院」則貢獻了 24 個數據點,包括一些離群點。

2、作者使用了一個叫 LOESS 方法,從離散的數據點中得到平滑曲線。這樣的曲線經常的確用來觀察大致趨勢,但是畢竟是「大致」的。作者卻在這條曲線上讀取到「8 月開始有明顯上升」。為了說明作者所犯的錯誤,我們指出,以作者的邏輯,同樣可以從曲線上讀出「12 月初武漢就開始封城」的可笑結論。這是因為類似的平滑方法會將突然出現的變化抹平。比如武漢封城造成的交通低谷,經過平滑處理,強度就會減弱,同時時間會延長,尤其是低谷的開始時間會提前。作者試圖從 LOESS 曲線讀取疫情開始的時間,犯的是同樣的錯誤。

3、LOESS 方法,簡單說來,就是只對局部的數據做線性回歸。為了明確「局部」的意思,需要設定一個 span 參數。比如作者選取了 span = 40%,意思是我們對一個點附近 40% 的數據點做線性回歸。可想而知,span 越大,曲線越平滑,但是也會丟失許多信息;span 越小,曲線波動越大,但是大致趨勢就沒那麼明顯。我們發現,對同樣的數據,如果改用 span = 30%,2019 年就出現了兩個新的交通高峰,而作者強調的 2019 年 8 月開始的峰看上去就不那麼特殊了。如果改成 span = 80%(可能是 R 軟體的默認值),則完全沒有什麼峰。因此作者選取的 40% span,可以說正好抹掉了 2019 年的前兩個峰,卻又正好保留了 2019 年最後的那個峰,因為後者是對作者最有利的。

根據上面的分析,我們得出的結論是:作者缺乏統計常識,並刻意調整參數。這是很嚴重的問題,也都是很常見的統計謬誤。但是不能說是「造假」。

--

最後我想說,我們非常歡迎大家下載並閱讀我們的論文。對於許多學生和科研人員來說,這都是一次關於數據和統計的學習,以後大家可以避免犯哈佛論文的錯誤。但是,我們不需要各位為了幫我們提升熱度而盲目的去訪問 DASH。

謝謝大家關注。


接到了論文一作的聯絡,更新一些以前有誤解的地方。

還有就是Will MA的推特沒有被封,是他自己關了一下推特,現在恢復了。所以並不是推特騷操作了。


瀉藥。

前邊回答過這篇文論的多處的站不住腳的地方,沒想到最後被翻出來就這些站不住腳的地方竟然還是造假得來的。

如何看待哈佛大學團隊用衛星數據,聲稱新冠肺炎自2019年8月已在武漢擴散??

www.zhihu.com圖標

前段時間剛好被 @庄有貓 同學安利了Will MA這個推主,對他的推特我也保持了高度關注,非常有收穫。剛好看到了這個推主針推哈佛停車場的造假論文的批判過程。在發布了駁斥文章後,也獲得了兩位著名的推特「學術紀委」@schneiderleonid和@MicrobiomDigest的大力支持。

可能光看著2個推特賬號名字大家沒什麼印象。我隨手給大家截個圖

眼熟不?這個就是揭露了全球多位知名科學家(包括中國的多位科學家,比如去年曹院士大瓜等等)的Elisabeth,她在斯坦福搞了多年的生命科學方向的科研,後邊辭職專門搞學術打假了,被稱為「學術紀委」。

Will MA他們在駁斥文章中,發現了這篇論文作者的多項學術不端行為,尤其是在停車場數據的非參擬合中為得到想要的結論刻意調整參數,這是在學術界最為不齒的行為。

這比方說,我想通過實驗想要得到結果A,結果實驗做出來的結果是B,然後為了滿足我對A的目標,我生生的把B擦了改成A一樣。

那以後還搞什麼科研做什麼實驗,就在家用PS和拍腦袋直接發論文唄。

當時考慮用這個栗子是為了通俗易懂,不過一作覺得這個不太恰當,因為原作者犯了統計學上的錯誤,嚴謹的說就是故意調整了某些統計參數以及選取了一些對他們觀點有利的數據來支撐他們的內容。

我想到了一個圖,給大家看一眼就能直觀的感受到這種操作手段。

原論文的操作手段大概就是屬於這樣子的:故意選取了有利於自己觀點的數據,而沒有完整的反映現實情況,按照駁斥論文里的說法,如果調整一個參數就會看到原論文里的觀點並不能得到有效的支撐。感興趣的可以搜一下「采櫻桃謬誤」。

科研守則最重要的一條就是尊重客觀事實,這種造假的人不配在學界待下去。

於是這個科研團隊也是求錘得錘。

當時推主Will MA也表示,他們為了針對這篇論文,把他們的反駁論文也發到了哈佛平台上。

然後我們就見證了一次,哈佛大學論文平台沖熱搜的過程。

最後我們再一次見證了中國小夥伴們的熱情,在丁香園轉發了這篇論文報道以後,這篇論文在哈佛的平台上生生的上了熱搜前三,把原來的那篇擠到了第五。我估計按著這種速度,在過幾天就能登頂了。

希望大家以本著學習數據統計的精神去下載這篇駁斥論文。

https://dash.harvard.edu/handle/1/42689379?

dash.harvard.edu

紅色的是反駁論文,黃色的是原文。


只要有人圍觀質疑你到底吃了幾碗粉,你最後證明了到底吃了幾碗粉都沒用了。

為何首爾市長自殺前一天被指控性侵?

為何美國一直搞不定的阿桑奇被瑞典以性侵起訴全球追捕?

為何明明塞爾維亞控制疫情是歐洲做的最好的,還是爆發了大規模抗議反對武契奇?

為何鮑毓明案子被財新記者寫成了霸道總裁愛上痴情缺愛小蘿莉的爽文?

為何大象公會會下斷言美國絕對沒人能隱瞞疫情?

為何很多人依然認為邁克爾傑克遜是為了當白人才把自己皮膚漂白的?

…………

很多事情都是這樣,議程設置好了,宣傳到位了,最後怪他真的假的,

謠言傳千里,闢謠不出門,

想像一下這樣一個場景,你是一個姑娘,走在大街上,突然衝出來一個潑婦打了你一巴掌,大罵你是小三,勾引她男人。

實際上你根本不認識她,她就是神經病,但是周圍的人已經圍觀過來了。

人們在討論的議題就是:你到底是不是勾引別人男人的小三了。

好了,自證一下清白吧。

事實上,沒人會持續關注你到你自證清白那天,到最後就是給圍觀的人留下了「這個女的涉嫌勾引別人男人做小三」

這種議題只要被設置出來了,就很難完全闢謠了。

殺人誅心,殺人誅心!可惡可惡!


能怎麼看,喜聞樂見唄。

事情要連起來看才有意思,今年簡直就是「洋八股」破產的一年。

之前吹哈佛等名校學術嚴謹,獨立思考。現在呢?不光卷進政治漩渦,手段還如此拙劣,獨立?嚴謹?學術精神?自由意志?

之前吹美國「法治之光」。黑人被警察壓死,驗屍報告前後出了幾份,結論不一,皮還沒扯完,後來乾脆說整件事都是「PS」的。就這?法治?都罔顧事實了,還法治?

之前吹美國體制,恨不得吹成人類有史以來最完美的制度。然後呢?一來應對疫情不力,二來提振經濟不力(哪怕硬上復工),三來應對暴亂不力(文,沒法說服,武,不敢撕破臉全面鎮壓)。反正,就是各種推諉扯皮黨爭甩鍋,說好的制衡呢?監督呢?

之前吹民風純樸,文明禮貌,結果,現在打砸搶燒且不說,連幾百年前的老帳黑料「歷史遺留問題」也都翻出來了,「亮麗的風景線」回了老家,原來,華麗的舊袍子底下都長瘡啊。

之前吹「全球化」,鄙視「大而全,小而全」,鄙視「18億畝耕地紅線」。現在,面臨疫情,蝗災,旱澇,逆全球化,國際局勢不穩定,貿易戰等等不利因素的疊加,發現最大的基本盤還是得立足於苦修內功。

反面教材越多,「洋八股」破產倒台越快,則中國越早越自信的開拓自己的道路。

苦當然是要苦上一陣子的(「緊日子」,「常態化」),但只要開動腦筋,辦法總比困難多,新世界的大門就在那裡,總有人會去打開。能換來成熟,道路自信,理論自信,道路創新,理論創新,值得。

眼看著「應聲蟲」,「跟屁蟲」們陸續啞火,爽!

感謝這麼多「洋教員」的言傳身教。

形勢不是小好,是大好。


老套路了,就和財新自己發稿自己刪的操作一樣,反正假消息已經放出去了並且有極大影響了,現在我哈佛說這論文數據有問題把稿撤了,我的理客中人設又閃閃發光了


推薦閱讀:
相关文章