假房源、假照片、假簡歷,甚至假貓……這羣人要把神經網絡玩壞了! 【前瞻網】 自媒體 第1張

人工智能越來越擅長對人類“撒謊”。盡管它們還無法說服、故意誤導他人,但它們已經能夠創造出不存在的聲音和圖像,看上去還逼真無比。

虛假的人類照片

近日,來自日本的研究人員利用神經網絡製作了逼真的高清視頻,裡面是各種各樣穿着衣服的人類圖像,但實際上並不存在。

假房源、假照片、假簡歷,甚至假貓……這羣人要把神經網絡玩壞了! 【前瞻網】 自媒體 第2張

(視頻截圖)

負責這次令人瞠目結舌的技術演示的公司是DataGrid,一家基於日本京都大學校園的初創公司。

正如視頻所示,人工智能算法可以想象出一連串逼真的人類圖像,並且衣服和形態能夠不斷變化。視頻中也沒有任何圖像偽影或奇怪的小毛病,這些“露餡”之處標志着生成圖像的嘗試失敗。

和許多生成式人工智能工具(包括去年佳士得拍賣會上拍出高價的人工智能藝術品)一樣,這個最新的演示是使用一種叫做生成式對抗網絡(GAN)的工具創建的。

GAN使兩個人工神經網絡相互競爭。在這種情況下,一個“生成器”網絡生成新的圖像,而另一個“鑒別器”網絡試圖找出哪些圖像是計算機生成的,哪些不是。隨着時間的推移,這個對抗過程讓“生成器”網絡變得足夠擅長創建圖像,從而每次都能成功地欺騙“鑒別器”。

不過,這或許也沒有想象的那麼難,因為視頻中的人類處於簡單的白色背景中,從而最大限度地減少了可能的背景混亂,這可能會影響創建的圖像質量。

這顯然是一個令人驚嘆的技術進步,但同時也讓人有些擔憂,有了這樣栩栩如生的AI圖像,假新聞或許也將變得更加難以分辨。

虛假的人臉

一個名叫ThisPersonDoesNotExist的網站利用對抗神經網絡也創造出了非常逼真的虛假人臉。

它利用的是英偉達在去年發布的StyleGAN算法,用真人照片來訓練,生成人工合成的類似照片。

(YOUTUBE截圖)

英偉達表示,其GAN是圍繞一個名為“風格轉移”的概念構建的。該系統分析了三種基本風格——粗糙、中等、精細——並將它們透明地融合成一種全新的東西,而不是試圖將不同面孔的元素復制粘貼到一個怪人身上。

“粗糙”包括姿勢、臉型或發型等參數。“中等”包括面部特徵,如鼻子、臉頰或嘴巴的形狀。最後,“精細”選項會影響面部特徵的顏色,比如皮膚和頭發。科學家們表示,為了消除與新合成人臉無關的噪聲,該發生器還“能夠從高級屬性中分離出無關緊要的變化”。

例如,它可以區分發型和真實的頭發,消除前者,而應用後者的最終照片。它還可以指定如何應用樣式來獲得或多或少微妙的效果。

英偉達的系統不僅能夠生成全新的合成人臉,還能無縫地修改真人的特定特徵,比如年齡、頭發或膚色。這樣一個系統的應用是驚人的。比如,人們可以準確地在做發型之前就預覽發型的變化。

ThisAirBNBDoesNotExist網站的創始人克里斯托弗•施密特(Christopher Schmidt)在接受採訪時說:“我之所以對這個ThisPersonDoesNotExist感興趣,是因為我不明白這樣的東西怎麼可能行得通。”

“我想,這個模型肯定是需要某個模板來製作圖像的。當我發現它不是——它真的能夠接受任何隨機的輸入集,並將其轉換成一張真實的臉的圖像時,我大吃一驚。我完全承認,我仍然不明白它是如何工作的,但我明白它確實能做到,這是一個有趣的領域。”

Airbnb虛假房源

Airbnb房源是另一個被網友們用來“調戲”的東西。ThisAirBNBDoesNotExist網站能夠自動生成不存在的Airbnb房源圖片,每次刷新都會出現一個虛假的房源,網頁上的照片、文字描述、發布人頭像均由計算機自動生成。

由於使用的模型非常簡單,文字描述多有不合邏輯之處,但乍看上去還是能以假亂真。

(網絡截圖)

根據 製作者Christopher Schmidt 在 Twitter 的介紹,生成每個網頁用一塊 GPU 只需 0.5 秒。

他表示,這個網站在構建圖片和臥室照片時使用 StyleGAN算法,一些文本網絡的訓練使用了tf.keras 來生成地點名稱、房主姓名、標題和描述。所有的數據訓練過程都在谷歌的Colab上完成,該平臺上可以免費使用GPU和TPU來訓練和生成數據。

每個模型都可以做出獨立的預測,所以會經常出現各部分信息不相配的情況,比如描述信息中說某套房子有一間臥室,但列表信息中顯示有四間臥室,或者外觀和名字排列不齊等。

虛假的抽象派畫作

Reddit上一位網友利用StyleGAN訓練生成了999幅抽象派畫作。在數據方面,採用的是Kaggle上名為”Painter by Numbers“項目中的數據集,其中大部分的圖像數據來源於http://WikiArt.org網站。

其中,只採用了≥1024X2014的圖像。在GTX 1080 TI上的訓練時間大約是5天。

不過作者表示,該模型試圖生成人臉的部分並不是很完美,但其它部分還算可以。

虛假的二次元角色

無限生成二次元妹子的網站也是利用StyleGAN算法製作的。這個網站能夠自動生成二次元角色。

“我考慮了內在的娛樂因素、高質量的可用性、數據和機器學習的真正困難等眾多因素,然後挑選了二次元角色。”ThisWaifuDoesNotExist網站的創始人Gwern Branwen稱。

“這並不是你在許多已發表的論文中都能看到的東西,而是每個人都能欣賞的東西:不好的結果很有趣,而好的結果甚至更有趣。”

虛假的貓、簡歷和初創公司

此外,還有網站能夠自動生成不存在的貓咪圖片,雖然其中有些看起來有點詭異。此外還有網站能夠生成虛假的簡歷,甚至是虛假的初創公司網頁。

(圖:虛假的貓)

(圖:虛假的簡歷)

(圖:虛假的初創公司網頁)

英偉達將StyleGAN算法開源後,不少人都利用它來做出了各種好玩的效果,其中最臭名昭著的就是“Deepfake”,它將一些女明星的臉“拼接”到色情演員身上。

除了以上這些例子,還有虛假的汽車、食物等等基於 StyleGAN 模型的“造假成果”,如雨後春筍一樣不斷湧現。甚至有人把這些“造假成果”匯總到了一個網站,叫“這些東西都不存在”。

這些類似的“造假”網站背後的技術都是一樣的,網站的大致佈局也一樣,允許用戶重複刷新,每次都提供100%的新圖片。

雖然這引發了人們的擔憂,但值得注意的是,完成這一任務需要在8個英偉達Tesla圖形處理器上進行為期一週的人工智能培訓,每個處理器的成本高達數千美元——而這些不是隨隨便便能辦到的事情。

相关文章