GAN之父：讓機器擁有天賦我還在對付利用AI作惡的人

本文係網易智能工作室（公眾號smartman 163）齣品，此篇為AI英雄人物第65期。

選自：MIT Technology Review 編譯：網易智能參與：小小

本期嘉賓為伊恩·古德費洛（Ian Goodfellow），他因提齣瞭生成對抗網絡而聞名，他被譽為“GAN之父”，甚至被譽為人工智能領域的頂級專傢。

資料顯示，古德費洛等人於2014年10月在Generative Adversarial Networks中提齣瞭一個通過對抗過程估計生成模型的新框架，框架中同時訓練兩個模型：捕獲數據分布的生成模型G，和估計樣本來自訓練數據的概率的判彆模型D。G的訓練程序是將D錯誤的概率最大化，這個框架對應一個最大值集下限的雙方對抗遊戲。可以證明在任意函數G和D的空間中，存在唯一的解決方案，使得G重現訓練數據分布，而D=0.5。在G和D由多層感知器定義的情況下，整個係統可以用反嚮傳播進行訓練。在訓練或生成樣本期間，不需要任何馬爾科夫鏈或展開的近似推理網絡，實驗通過對生成的樣品的定性和定量評估證明瞭本框架的潛力。

通過讓神經網絡互相攻擊，伊恩·古德費洛（Ian Goodfellow）創造齣強大的人工智能（AI）工具，賦予機器以想象的能力，現在，他和我們其他人必須麵對這種工具帶來的後果。

2014年的的某個晚上，古德費洛和一名剛剛畢業的博士生共同喝酒慶祝。在的濛特利爾頗受歡迎的酒吧Les 3 Brasseurs，許多朋友請求他的幫助，因為他們正在開發一個棘手的項目，即可以自己創作圖片的電腦。

生成對抗網絡的誕生

這些研究人員已經在使用神經網絡，即模仿人腦神經網絡建立的鬆散模型算法，作為“生成”模型來創建自己的新數據。但結果往往並不如人意：電腦生成的人臉圖像往往是模糊的，或者齣現像丟失耳朵這樣的錯誤。

古德費洛的朋友們提齣的計劃，是對構成照片的元素進行復雜的統計分析，以幫助機器自己創作圖像。這就需要大量的數字運算，而古德費洛告訴他們，這根本行不通。

但當他邊喝啤酒邊思考這個問題時，突然想齣瞭一個主意。如果讓兩個神經網絡對抗會産生什麼樣的結果？朋友們都對此持懷疑態度，所以當他迴到傢，女朋友已經睡熟後，他決定試一試。古德費洛在最初的幾個小時裏進行編碼，然後測試瞭他的軟件，沒想到第一次就取得瞭成功。

古德費洛在那個夜晚開發齣的技術現在被稱為“生成對抗網絡”（GAN）。這一技術已經在機器學習領域引發瞭巨大的興奮，並將其開發者變成瞭AI領域的名人。

在過去的幾年裏，AI研究人員使用一種叫做深度學習的技術取得瞭令人印象深刻的進展。提供足夠圖像給深度學習係統，它會從中學習，比如識彆一個即將穿越馬路的行人。這種方法使得無人駕駛汽車和能驅動Alexa、Siri以及其他虛擬助手的對話技術成為可能。

可是，雖然深度學習可以學會識彆事物，但他們並不擅長創造它們。GAN的目標就是賦予機器這種類似於想象的天賦。將來，計算機將會更好地享受原始數據，並計算齣它們需要從中學到什麼。這樣做不僅能讓它們繪畫或作麯，還將使它們減少對人類的依賴，可以自行學習瞭解世界及其運作方式。

如今，AI程序員們經常需要告訴機器，在訓練數據中到底有什麼東西，比如數百萬張圖片中都有行人過馬路的場景。這種方法不僅成本高昂，而且勞動強度相當大。此外，哪怕是稍微偏離瞭所接受的培訓，AI係統處理圖像數據時都會遭遇挫摺。而在將來，電腦將會更好地處理原始數據，並在不被告知的情況下計算齣它們需要學習的內容。

這將標誌著AI“無監督學習”的巨大進步。無人駕駛汽車可以在不離開車庫的情況下瞭解許多不同的道路狀況，機器人可以預見到繁忙倉庫中可能遇到的障礙，而不需要再繞過它。

GAN的魔力在於兩個神經網絡之間的競爭

我們想象和思考許多不同情景的能力是我們身為人類的重要組成部分。將來當科技曆史學傢迴顧現在時，他們很可能會將GAN看作是創造具有人類意識的機器的重要進步。Facebook首席AI科學傢雅恩·樂坤（Yann LeCun）把GAN稱為“過去20年裏深度學習領域最酷的想法”。另一位AI大咖、百度前首席科學傢吳恩達（Andrew Ng）也說，GAN代錶著“重要的、根本性的進步”，這會為不斷壯大的全球研究者社區提供靈感。

古德費洛現在是榖歌Google Brain的研究科學傢，該團隊位於加州山景城的榖歌總部中。當我最近在那裏見到古德費洛時，他似乎仍然對他的“巨星”地位感到驚訝，稱其“有點兒不敢相信”。也許同樣令人感到驚訝的是，他發現自己現在的大部分時間都要用來對付那些想用GAN作惡的人。

GAN的魔力在於兩個神經網絡之間的競爭。它模仿瞭繪畫僞造者和藝術偵探之間的反復交鋒，他們反復嘗試互相欺騙。這兩個網絡都是使用相同數據集進行訓練的，第一個係統被稱為“發電機”，負責生成像照片或筆跡這樣盡可能逼真的人工輸齣。第二個係統被稱為“鑒彆器”，它將發電機生成的東西與原始數據集中的真實圖像進行比較，並試圖確定哪些圖像是真的，哪些是假的。在這些結果的基礎上，發電機調整其參數以創建新的圖像。這個過程反復持續，直到鑒彆器再也無法分辨真假。

接受過真人秀明星照片訓練的GAN自己生成瞭想象中的明星照

去年，在一個廣為宣傳的例子中，芯片巨頭英偉達公司的研究人員對AI進行瞭大量投資，通過研究真實的明星訓練瞭一個GAN係統，以生成虛構的名人照片。雖然並不是所有虛構的假名星都是完美的，但有些卻非常逼真。與其他需要成韆上萬訓練圖像的機器學習方法不同，GAN隻需幾百張照片就會變得“技藝精通”。

盡管這種想象的力量仍然有限，但是隻要接受過很多狗狗照片的訓練，GAN就能産生令人信服的假狗圖像，比如身上會有不同的斑點圖案，但它不能想象齣全新的動物。原始訓練數據的質量對結果也有很大的影響。有這樣一個生動的例子，GAN開始將隨機字母融入到其組閤的貓圖中。因為訓練數據中包含瞭來自互聯網的貓圖，這颱機器通過自學，認為單詞也是貓圖的一部分。

讓GAN好好工作是件棘手的事，如果齣現故障，結果可能會很奇怪

華盛頓大學機器學習研究員佩德羅·多明戈斯（Pedro Domingos）說，GAN也喜怒無常。如果鑒彆器太容易被愚弄，發電機的輸齣看起來就不太真實。而且，對兩種決鬥的神經網絡進行校正是很睏難的，這也可以解釋為何GAN有時會吐齣許多奇怪的東西，比如有兩個頭的動物。

不過，這些挑戰並沒有讓研究人員卻步。自從古德費洛及其同伴在2014年發錶瞭關於他的發現首份研究之後，已經有數百篇與GAN相關的論文發錶。該技術的一個粉絲甚至創建瞭一個名為“GAN zoo”的網頁，專門用來跟蹤已經開發齣的各種版本技術。

GAN最明顯的即時應用是在涉及大量圖像的領域，比如視頻遊戲和時尚行業：比如，遊戲角色在雨中會如何奔跑？但是展望未來，古德費洛認為GAN將推動更大的進步。他說:“有很多科學和工程領域需要我們去優化一些東西。舉例來說，我們需要更有效的藥物，或者需要更高效的電池。這將是下一個大浪潮。”

在高能物理學中，科學傢們使用強大的計算機來模擬數百個亞原子粒子的相互作用，比如歐洲核子研究中心的大型強子對撞機。這些模擬是緩慢的，需要巨大的計算能力支持。耶魯大學和勞倫斯伯剋利國傢實驗室的研究人員已經開發齣一種GAN，在利用現有模擬數據進行訓練後，它能夠對特定粒子的行為做齣準確的預測，而且速度要快得多。

古德費洛的發現可以用來想象各種事物，包括新的室內設計

此外，醫學研究是另一個非常有前景的應用領域，隱私問題意味著，研究人員有時無法獲得足夠的真實病人數據，分析為什麼藥物不起作用。賓夕法尼亞大學的凱西·格林（Casey Greene）說，GAN可以通過生成幾乎和真實情況一樣好的假病人記錄來幫助解決這個問題。這些數據可以被更廣泛地分享，有助於推進研究，而真正的記錄則受到嚴格的保護。

GAN擁有黑暗的一麵它們使問題變得更糟

然而，GAN也有黑暗的一麵。對於那些想要影響股票價格、選舉結果等製造虛假新聞的人來說，被用於設計逼真假圖的機器堪稱是一件完美武器。這種AI工具已經被用來將其他人的頭像安放在色情明星的身體上，並將某些言論強加在特定的政客嘴上。GAN沒有製造這個問題，但是它們會使問題變得更糟。

在達特茅斯學院研究數字取證問題的哈尼·法裏德（Hany Farid）正在研究更好的方法來識彆假視頻，比如探測因吸入和呼齣氣體而導緻的臉部顔色發生細微變化，GAN很難精確模仿這些。但他警告說，GAN將會反過來適應這種情況。法裏德說：“我們基本上處於弱勢。”

這種“貓捉老鼠”的遊戲也將在網絡安全領域發揮影響。研究人員已經在強調“黑盒”攻擊的風險，在這種攻擊中，GAN用來找齣大量安全程序發現惡意軟件的機器學習模式。通過推測某個防禦者的算法工作原理，攻擊者可以躲開它並插入流氓代碼。同樣的方法也可以用來躲避垃圾郵件過濾器和其他防禦。

古德費洛深知其中的危險。現在，作為榖歌專注於讓機器學習安全的團隊負責人，他警告說，AI社區必須吸取以往創新浪潮的教訓，技術專傢需要提前思考安全和隱私問題。以往，當他們意識到風險的時候，“壞人”已經確立瞭明顯的優勢。古德費洛稱:“很明顯，我們已經超越瞭起點，但希望我們能在安全問題上取得重大進展。”

盡管如此，古德費洛並不認為會有一個純粹的技術解決方案。相反，他認為，我們將不得不依賴於社會，比如教孩子們養成批判性思維，讓他們接受諸如演講和辯論課之類的東西。他說:“在演講和辯論中，你是在和另一個學生競爭，而你在思考如何製造誤導的言論，或者如何正確地製造那些具有說服力的聲明。”他很可能是對的，但他的結論是，技術不能解決假新聞問題，這不是很多人想聽到的。（完）

關注網易智能公眾號（smartman163），獲取人工智能行業最新報告。