如何看待哈佛研究被指通過捏造數據，以證明疫情始於 8 月武漢？

哥廷根大學、哈佛大學、浙江大學、武漢協和醫院的中國研究人員一起，對聲稱去年8月武漢就有新冠疫情的哈佛論文的數據進行了重新分析，發現了哈佛團隊更多的學術不端行為，尤其是在停車場數據的非參擬合中為得到想要的結論刻意調整參數。
目前，哈佛原論文已被撤稿。

對哈佛論文的評議文章原文：Comment on 「Analysis of hospital traffic and search engine data in Wuhan China indicates early disease activity in the Fall of 2019" by Nsoesie et al.

相關討論：
如何看待哈佛大學一篇論文，利用衛星圖像和百度檢索數據推測新冠發生於 2019 年 8 月？?
www.zhihu.com

大家好，我是哈佛論文的批評文章的作者之一，受第一作者的委託發布下面這個回答。（作者已授權本文的署名轉載）

大家好，我是德國哥廷根大學應用與數值數學所的陳浩博士。我之前在知乎先後用過 @陳浩和 @Dr How 兩個 ID，大概一兩年前註銷了賬號。

@冷哲的答案中提到的對哈佛論文的批評文章，我是第一作者，與 William Ma 同為通訊作者，也是我們五人團隊的召集人。這個問題下面的許多回答對我們的工作多有或多或少的誤解，因此我們非常感謝知乎團隊和我們聯繫，讓我們有機會在知乎介紹一下我們的論文。

我是 2020 年 6 月 15 日產生寫這篇批評論文的想法。哈佛論文通過預印本+新聞通稿的形式，繞過同行評審推廣不靠譜的結果，在我看來是非常不道德的。我最初是想在 PubPeer 上發評論，結果發現哈佛論文沒有 DOI，因此沒有被 PubPeer 收錄。這讓我更加生氣。因此我想：既然你假裝自己是論文，我就以論文的標準對待你。一篇有問題的論文會被怎樣對待？會有許多同行寫文章批評，最終被迫撤稿，作者的學術聲譽也會產生永久的污點。所以我決定寫一篇批評文章，在學術文獻中留下記錄，成為哈佛團隊永遠的污點。

需要強調的是，我們並不試圖在新聞媒體中獲得比原文更高的關注和流行度。我們的目標是以學術圈的標準做法，對有問題的研究提出批評，並留下永久的記錄。

我自己是做數學的，為了保證學術上的嚴謹，我邀請了有統計背景的 William Ma 和來自浙江大學、哈佛大學、及武漢協和醫院的三位醫藥背景的學者。然後我們邀請了世界各地多位學者、記者、和熱心人士幫我們校對稿件，提出意見。最終我們在 7 月 3 日把批評文章放到我的個人主頁公開（鏈接：http://num.math.uni-goettingen.de/~hchen/documents/COVID19.pdf ），同時上傳哈佛大學的 DASH 平台，即原文所在的平台。

我們的文章發布後，我立即聯繫了幾位學術打假圈的名人，包括 Elisabeth Bik 和 Leonid Schneider。兩位都對我們的工作表達了肯定，並轉發我們的文章。Schneider 甚至呼籲 medRxiv 打破不收 commentary 的政策，破格收錄我們的批評（最後並沒有成）。

7 月 8 日，我們的文章被 DASH 平台收錄。與此同時，DASH 平台的管理員告知我們，原文的狀態已經從 accepted manuscript 更新為 authors original。這個更新有很多信息，但是到底意味著什麼，我們只能揣測。根據我們掌握的信息，原文作者確實已經投了期刊，但是應該並沒有被接收，所以當時剛看到 accepted manuscript 這個狀態時，我們就比較驚訝。後來的狀態更新，可能確實是投稿了，可能是之前誤報現在糾正，我們不知道。我們也不知道這個狀態更新是否與我們的批評文章有關。

值得一提的是，DASH 平台從一開始就非常支持我們，甚至加急處理了我們的投稿。這種不遮醜的態度非常值得敬佩。

接下來，我簡要說一下我們批評了哈佛論文哪些方面。哈佛論文在社交媒體上已經有許多批評，但是其中能達到學術論證標準的並不多。我們提出一項學術批評之前，都會儘力為對方辯護；如果能輕易辯護的，我們就不再花精力。這有時叫做 principle of charity（慈善原則），為的是做出最有效的反駁。

我們團隊中有人聯繫過作者，得知作者使用的搜索關鍵字是莫名其妙的「腹瀉的癥狀」。作者聲稱觀察到的搜索量上升，在「腹瀉」「拉肚子」「氣短」「呼吸困難」等更典型的搜索中，都沒有出現。這坐實作者犯了「采櫻桃謬誤」，即只彙報對結論有利的證據，隱瞞了其他證據。這種做法通常來說是灰色地帶，因為一般被隱瞞的證據都可以推脫給「儀器沒調好」之類的理由。但是哈佛團隊是在用互聯網，這種理由是不成立的。因此我們認為這是學術不端行為，也是我們批判的重點之一（Sec. 4）。

此外我們也提到了 ABC 新聞報道用圖的問題。但是根據慈善原則，我們對此沒有深究，只是建議原文作者澄清這些圖是不是他們提供的。另外還提到了作者選取湖北省婦幼保健院的謎之操作。以上這幾個論點是和社交媒體有重疊的；社交媒體中的其他批評，我們經審核後認為不夠強，決定棄之不用。

對於哈佛論文對停車場的分析，我們用軟體從他們的圖表中提取了數據，然後做了詳細的檢查，發現許多之前沒有人注意到的數據和統計方面的嚴重問題。下面是一些簡要的描述。

1、作者收集的數據少，質量低。29 個月的時間裡作者從六家醫院只收集了 140 個數據，平均每家醫院每個月都不到一個數據。其中 30 個數據點集中在最後兩個月。在前 27 個月，有三家醫院分別只貢獻了 7，8，10 個數據點，而莫名其妙的「湖北省婦幼保健院」則貢獻了 24 個數據點，包括一些離群點。

2、作者使用了一個叫 LOESS 方法，從離散的數據點中得到平滑曲線。這樣的曲線經常的確用來觀察大致趨勢，但是畢竟是「大致」的。作者卻在這條曲線上讀取到「8 月開始有明顯上升」。為了說明作者所犯的錯誤，我們指出，以作者的邏輯，同樣可以從曲線上讀出「12 月初武漢就開始封城」的可笑結論。這是因為類似的平滑方法會將突然出現的變化抹平。比如武漢封城造成的交通低谷，經過平滑處理，強度就會減弱，同時時間會延長，尤其是低谷的開始時間會提前。作者試圖從 LOESS 曲線讀取疫情開始的時間，犯的是同樣的錯誤。

3、LOESS 方法，簡單說來，就是只對局部的數據做線性回歸。為了明確「局部」的意思，需要設定一個 span 參數。比如作者選取了 span = 40%，意思是我們對一個點附近 40% 的數據點做線性回歸。可想而知，span 越大，曲線越平滑，但是也會丟失許多信息；span 越小，曲線波動越大，但是大致趨勢就沒那麼明顯。我們發現，對同樣的數據，如果改用 span = 30%，2019 年就出現了兩個新的交通高峰，而作者強調的 2019 年 8 月開始的峰看上去就不那麼特殊了。如果改成 span = 80%（可能是 R 軟體的默認值），則完全沒有什麼峰。因此作者選取的 40% span，可以說正好抹掉了 2019 年的前兩個峰，卻又正好保留了 2019 年最後的那個峰，因為後者是對作者最有利的。

根據上面的分析，我們得出的結論是：作者缺乏統計常識，並刻意調整參數。這是很嚴重的問題，也都是很常見的統計謬誤。但是不能說是「造假」。

最後我想說，我們非常歡迎大家下載並閱讀我們的論文。對於許多學生和科研人員來說，這都是一次關於數據和統計的學習，以後大家可以避免犯哈佛論文的錯誤。但是，我們不需要各位為了幫我們提升熱度而盲目的去訪問 DASH。

謝謝大家關注。

接到了論文一作的聯絡，更新一些以前有誤解的地方。

還有就是Will MA的推特沒有被封，是他自己關了一下推特，現在恢復了。所以並不是推特騷操作了。

瀉藥。

前邊回答過這篇文論的多處的站不住腳的地方，沒想到最後被翻出來就這些站不住腳的地方竟然還是造假得來的。

如何看待哈佛大學團隊用衛星數據，聲稱新冠肺炎自2019年8月已在武漢擴散？?

www.zhihu.com

前段時間剛好被 @庄有貓同學安利了Will MA這個推主，對他的推特我也保持了高度關注，非常有收穫。剛好看到了這個推主針推哈佛停車場的造假論文的批判過程。在發布了駁斥文章後，也獲得了兩位著名的推特「學術紀委」@schneiderleonid和@MicrobiomDigest的大力支持。

可能光看著2個推特賬號名字大家沒什麼印象。我隨手給大家截個圖