包括但不限於論文本身的寫作,創新點,提供的源碼,希望各位的真知灼見能給後來者啟發。


其實都是由於Dead lock。

/*會議惡性循環*/

投稿量爆炸—&>Reviewer不夠—&>審稿人水平參差不齊 —&> 錄取Paper水平參差不齊—&>讀者看到水paper感覺這也能中—&>模仿水paper生產科研—&>投稿量爆炸

/*領域惡性循環*/

做實驗性能非常好—&>強行尬解釋—&>其實都是猜想,真正work的可能是trick—&>產生糟糕的玄學paper—&>讀者糟糕的閱讀體驗—&>讀者模仿科研—&>讀者做實驗使得性能非常好—&>......


這麼多吐槽的,我就不說誰的論文不好了,我想說說我認為什麼樣的工作好。其實今天AI科研界和網紅界差不多,被大多數人認為所謂好的AI工作者和網紅一樣,都長得差不多,不都是寫著模式差不多的論文,灌了差不多的多少頂會么。後面還有一堆新畢業的博士,在努力爭取長成網紅臉。在這個領域,你要長的不是網紅臉,你只能被當作異類處理。

這年月大家都在拿論文數量,引用,影響因子說事,特別是國內的老師學生,太看重這些了。我個人覺得這完全背離了科研工作的本意。這和武術變得主要要比誰一個跟頭落地能紋絲不動,花樣滑冰要比誰四周跳跳的多一樣,忘記了武術的本質是要充分利用人體結構來合理髮力,花樣滑冰的核心是追求音樂動作合一的表現力一樣,都走上了歧途。

這個世界做科研的,工作模式大致兩類,一個是到處挖坑的,一個是一輩子挖一個坑的。這兩種工作模式都可以,問題是挖坑一定要挖好東西,不能總挖垃圾。

我可以舉一例我看到的挖坑挖的好的人, S. Lloyd,此人是量子信息領域的到處挖坑的大牛,每個方向只挖一鏟子,挖完就走。他的主要貢獻: (1)證明了Feynman關於用量子計算模擬量子系統的一個想法,(2)最早做量子計算硬體的,(3)提出了從量子計算構建時空結構的一種方法,(4)提出了一個時間旅行的模型並用於分析黑洞信息問題,(5)提出了Shor, Grove之後的第三個實用化量子演算法,主要用於量子機器學習,(6)提出量子雷達的概念,(7)考察了計算和物理規律的關係。這些只是我看到的他的一部分工作,這已經證明此人的牛叉之處了。問題是,他在每個方向都基本只寫一篇論文,最多也不會超過3篇,然後有點老子留下五千言後言盡於此的氣概,轉身而去,重新挖坑,留下一堆身後的人在他挖過的地方繼續挖,但是都很少能挖到他的高度。最近有一段時間沒看到他的消息了,不知道這位又在憋著挖什麼呢。

所以他的論文並不多,也就平均一年一篇吧(真正他寫的,掛名的不算,不過我也沒看到他有多少掛名的論文,有他名字的論文都是明顯能看到他的思想貢獻的),但是每一篇都是一個新思想新方向。我覺得這才是好的工作應該有的樣子。按照這個標準,大家可以對比一下,哪些工作可以叫垃圾。

另外,如果聽報告的時候,介紹里說此人寫了幾百篇論文,我建議大家轉身就走,因為大概率的,此人大概不會有什麼深刻的思想傳達給你。

真心的建議大家進入科研領域後都仔細想想,是要一輩子做垃圾研究發一堆垃圾論文呢,還是沉下心來找好問題做好問題。對於一個科研人員來說,一輩子有一篇真正重要的論文就足夠了,甚至有可能在他死之前,論文的重要性都沒有被發現,這就是科研這份工作的規律。追求短期反饋絕對是違背科研規律的,對於個人評判工作好壞,是誤導,對於國家評判科研,是惡政。

楊振寧先生說,和小說一樣,科研和論文也有風格。一個領域應該有不同風格的工作和論文,風格多樣性是一個領域活力的體現。Schwinger的繁瑣嚴謹是一種風格,Feynman的靈動純粹也是一種風格,Dirac的透徹深邃還是一種風格,Einstein的宏大鳥瞰又是一類風格,這個世界的科研絕不只有一種風格一個模式,他們都是好工作。我個人的感覺,AI這個領域的論文風格過於單一了,除了一些偏理論的工作外,絕大多數與應用有關的工作風格嚴重雷同,思想嚴重雷同,這種論文真是讀起來面目可憎味同嚼蠟。我覺得這絕對不是好事情,這說明這個領域的思想過於單一。特別是小孩子們,一進入這個領域就被這個領域已有的固定思維帶著跑了,他們沒有時間去左顧右盼,去想想是否有其他可能性,他們只有沿著前人的路飛速的跑,否則他們就不能在這條路上跑得過別人,但我真的覺得,這個情況對於無論個人還是領域,都不是好事。

最後一點,AI作為新興領域,出現一個我認為是很不好的現象,就是大量本科生進入領域發表論文並且成為風氣。從我的角度看,本科生的工作做到我的標準之下所謂好的工作的,是非常非常罕見的(如果不是一個都沒有),我覺得時間這件事真的是不能隨便超越,人的認知水平一定和時間有關,本科生進入AI只是作為科研訓練,真的不能指望有什麼好工作出現,一個本科生做了半年一年就出好工作?對不起,我不信。我真心不希望AI這個領域鬧到和材料生化一樣成為灌水園地。

讓我們大家都保留一點科研工作的初心,爭取去做好的工作,學會辨別和欣賞好的工作,特別是年輕人,要培養好的科研品味,不要一上手就把味蕾弄壞了。我在知乎看到太多博士生朋友的味蕾已經完全壞了,根本不知道好的思想為何物,很不幸。

思想才是科研的核心,一個真正閃光的思想比一堆代碼和數據實驗都有價值,代碼和實驗是為思想服務的,絕不能替代思想。千萬別說talk is cheap了,愛因斯坦這輩子都在think and talk, 他的talk實在是他思想的精華。

卞子守函谷,終南紫氣多,借言屈子問,天機且如何。

算力方暴虎,AI正馮河,掛書青牛角,天工莫可奪。

與君歌一曲,請君聽我明日歌。明日待回頭,今日喧囂一夢柯。


吃瓜群眾昨天看這個問題吃瓜吃了一晚上,忍不住來回答一下;

目前所有回答里爭議最大(討論最激烈)的文章是 https://arxiv.org/abs/1811.00250 這篇利用GM進行網路剪枝的文章。

最早的一個匿名回答里提到了很多疑問,然後文章作者也大方地站出來回答了。

但是另一個問題出現了,有人隨後指出文章中的公式(6)到公式(10)有明顯錯誤,應該撤稿。特別是公式(10):

這個錯誤多明顯就不用多說了。該回答也得到了很多領域內著名學者大佬的點贊,甚至導致了作者本來頗受好評的「知乎rebuttal」評論區也(對,吃瓜群眾評論區也看)淪陷了。

本著理性吃瓜的心(其實也有一點點懷疑CVPR的reviewer真的會放過這種低級錯誤),我認真地讀了文章(也看了作者更新在github上的版本),先簡單說一下結論,然後再跟大家仔細捋。

結論:

  1. 作者數學公式和一些數學符號非常不熟練, [公式] 的問題大家已經指出來了(作者在更正版里修改了,沒有錯誤了,但是改完的還是很不優雅);

2. 公式(9-10)錯的很離譜,但是其實完全是應該刪掉的,公式(10)試圖證明一個十分明顯,無需證明的結論,但是作者給整劈叉了。公式(9)和公式(10)首先不符合公式(8)定義(雖然(8)寫的也亂七八糟,但是我們可以從上下文猜出(8)是要幹嘛,並且(8)是完全合理的),然後進一步暴露了寫作者數學和公式不熟練的問題,也可能是文章的Section 3.4 寫完後其他co-author沒有好好改,或者亂改了一通;

3. 公式的問題很嚴重但是文章的其他部分還是很不錯的(至少我覺得),至少不低於CVPR2019平均水平,不必被大家噴成現在這樣。感覺reviewer應該也提出來了公式太亂的問題,但是作者camera-ready沒好好改,然後因為明顯的錯誤被噴了(但是公式的問題我就不能忍,又氣又想笑,這也提醒我們:camera-ready改不好,知乎rebuttal兩行淚);


然後跟大家稍微捋捋這篇文章與公式10相關的部分,首先是 [公式] 的定義:

[公式]

原文公式(3)。我們公式標號與原文保持一致,公式表示上的差異也盡量在「引用塊」里說清楚

簡單解釋一下, [公式] 表示第 [公式] 個卷積層的第 [公式] 個卷積核, [公式] 表示 [公式] 到這些卷積核的歐幾里得距離之和。

作者文中假設,位於geometric median (即 [公式])附近的點因為可以被其他點代替,所以並不重要,可以被剪枝剪掉。

但是問題在於geometric median並不一定在第 [公式] 個卷積層的這些卷積核中(這是非常可能的),因此退而求其次地,作者希望在第 [公式] 層的這 [公式] 個卷積核中找到對應的 [公式] 最小的那一個,並認為這是這些卷積核中最接近geometric median的卷積核,並把它作為剪除對象

也就是說,作者定義的剪枝對象是下面這個:

[公式]

這個公式是從作者的修改版本里摘出來的公式(4),作者原文中的公式(6)是這個意思,但是因為 [公式] 用錯已經被大家鞭屍了,如果仔細結合上下文的話,應該能猜出來原文公式(6)是這個意思;

現在有趣的地方來了,因為要在 [公式] 中找令 [公式] 最小的。假設 [公式] 是滿足 [公式] 最小的一項,作者發現在計算過程中[公式] ,當 [公式] 的時候對應的項竟然是0,所以作者定義了 [公式] :

[公式]

這個公式同樣從修改版本里摘里摘出來的公式(6),對應原文公式(8),雖然這麼改了還是看著不優雅。但是跟原文錯誤的公式(9)以及順帶錯了的公式(10)相比,這個可以接受。

作者原文實際的意思是:你們用 [公式][公式] 求最小的 [公式] 結果是一樣的,因為 [公式] 求和的時候 [公式]的時候對應的那一項是0,是不用管的!

這個事其實不用過分說明,因為太明顯了(實際在代碼實現上我們甚至偏愛使用 [公式] ,因為簡單)。但是作者弄巧成拙地根據公式(8)寫下了公式(9):

這裡的 [公式][公式] (當然也是公式(8)里定義的正確的 [公式] )在條件下的最小值。作者的意思是: [公式] 的最優值和 [公式] 都是 [公式] ,那麼我減去一個 [公式] 不影響最優值和優化過程鴨。(內心:本來還想給您平反,看到這裡真覺得這數學白學了

然後公式(10)本想證明 [公式][公式] 最優值一樣,但是基於完全錯誤的公式(9),公式(10)就成了被大家嘲笑的摸樣。

但是其實公式(9)和公式(10)完全不用寫,不知道是不是因為reviewer說,你這文章沒啥公式哇,然後作者就不小心寫下了這錯誤的證明。

// 不想寫了,吃瓜群眾的熱情被一團亂麻的公式耗沒了,,有人覺得哪不清楚,我回頭再改吧。


作為一個理性吃瓜群眾(和學術小白),寫這麼多,當然不是為了吐槽誰。按照周志華老師等諸多大佬「發現閃光點」的標準,這篇文章是顯然值得接收的,但是另一方面文章中的公式組織卻一團糟,瑜不掩瑕,被大家拿來調侃。這件事展開講有趣的地方可多了,但是地方太小了我寫不下(逃);只希望大家理性吃瓜,合理吐槽,肯定亮點,拒絕戾氣我們真正討厭的是那些明知灌水還灌地賊開心的人。


都是要吃飯的嘛,可能文不對題。。。超分就是每年在這麼刷榜,灌水

講一下圖像復原領域,超分,去噪,去模糊

上圖引用自:A Deep Journey into Super-resolution: A Survey

https://arxiv.org/pdf/1904.07523.pdf?

arxiv.org


我來主題無關了。

我15年讀的研一,當時頂會論文也是出一波看一波,我感覺現在幾年論文明顯更會包裝了,即使很簡單的東西,也要精心的扯上一些東西,至少看起來很華麗。我剛剛入門的時候,主要做檢索,當時深度學習檢索還剛剛興起,一堆論文放到現在,估計要被罵到猴年馬月了。

1.當時俄羅斯yandex 出了文章,就是標註了一個數據集,然後train一下,抽特徵直接檢索,引用賊多,喜提頂會一篇。

2.好像是某大組的一篇文章,啥也沒幹,就是在最後一層抽特徵之前加了一個物體基本上都是靠近中心的,所以中心的特徵更加重要,這種先驗知識,然後抽了一波特徵,喜提ICCV一篇。

3.還有一大堆文章 pairwise loss triplet loss直接拿來用,放上去我就不說了。各種 頂會,還包括siggarph,拿到手軟。

4.還有一次看到一篇檢索的文章,就是把1裡面的數據集拿過來,直接標註了一下bbox,然後抽特徵,又是triplet loss,又是一篇ICCV+ IJCV。操作不要太騷。

註:前面說的文章作者都是老外。

我還記得當時看這些文章的時候,痛心疾首,我咋不早生幾年??

PS:純吐槽,不針對誰...


推薦閱讀:
相关文章