【 數位本質中的新空間敘事 】 https://www.zhihu.com/video/1047664175391834112

直播網站 Twitch 在 2017 年曾出現一起有名的「 AI 直播主事件 」——《 GTA5 區上直播開車的查爾斯 》[注-1],一個用 Python 寫成的、使用神經網路進行深度學習的 AI 程序。「 查爾斯 」透過自己在數位世界裡對畫面的即時分析,在試錯中總結出來自己能順利前進的「 交通規則 」。也由於近年的圖像合成發展,大多能通過——代表所有圖像外觀權重、所有數據的深層網路參數模型來驅動。這與人類寫實畫家的做法完全不同,它們並不是依靠「 記憶 」在神經網路內空間中作畫,而是用外部參考當做材料來源,再現目標物體的外觀細節。通過這種語義佈局、神經網路甚至能根據自己在訓練過程中見過的真實街道,生成一個未曾存在的場境。那、面對一個由機器「 假想 」出來的城市,視覺藝術家們會如何佈局創作概念?《 前文明意識網路 》即是一個試圖在視覺辨識系統中進行塗鴉的計畫。

用深度神經網路進行現實圖像合成、也為模擬現實圖像開闢了許多新方法,例如、史丹佛大學博士( 陳啓峯 )與 Intel 實驗室視覺組主管( Vladlen Koltun )日前就曾展示了一種通過「 語義佈局 」來合成照片的方法,經過三千張德國街道照片的訓練,遇到輸入的佈局上標註成「 Car 」的部分,這個見過很多車的演演算法,就會自己生成一輛車,填補進去。這個演演算法可以看作是一個渲染引擎,而按照圖上佈局,輸出一張逼真的照片。該項技術可以僅憑靠對一個世界的單純描述,便讓人工智慧在虛擬現實中將其打造出來[注-2]。如果說、GTA5 區上直播開車的查爾斯,是透過自己在數位世界裡對畫面的即時分析,在試錯中總結出來自己能順利前進的「 交通規則 」、那上述的這種場境就是電腦藉由穿梭在數據網路中的世界( 例如 Google 地圖 )所自我學習而得出的一種廣義的內在虛構城市。

這種世界的被生產是原生於數據、虛擬,和、電玩遊戲中常見的那些被模擬出來的數位場景,所陳述的「 空間定義 」存在極大差異。因為無人車運行時會建構一個內部虛像城市,而這樣的軟體開發,大多是在模擬器中進行的[注-3]。在「 那裡 」,快速的原型設計和迭代( Iteration ),甚至比在現實世界裡所使用的真實硬體要高效得多。電腦科學家——傑?福雷斯特( Jay Wright Forrester )[注-4] 亦曾提及「 我們周圍的世界在我們的大腦中只是一個模型 」,沒有人的大腦可以想像整個世界,所有政府、或國家。大腦只選擇概念及其之間的關係,然後使用它們表徵真實的系統。《 前文明意識網路 》就是企圖在這個正在逐步形構的、機器集合的內部空間中,進行繪畫滲透的行動——這也一種對正在滋長的( 未來的 )前文明意識網路之滲透。因為,現在無論是交通、貨幣、社會安全,幾乎都在建構一個高度統一的電子化社會,如果我在這些「 意識網路 」成為未來文明之前、能在先在裡面創造「 遺跡 」??

[注-1] 《 Twitch 上最火的GTA5主播是個 AI 》 chuapp.com/article/2831

[注-2] 參考論文《 Photographic Image Synthesis 》cqf.io/ImageSynthesis/ 、代碼託管處:github.com/CQFIO/Photog

[注-3] 直到最近、大部分人才意識到:一幅標有「 車道線、坡度、甚至是一塊高度約 10 釐米凹坑 」的詳細地圖信息對無人駕駛汽車的重要性。mp.weixin.qq.com/s/vFyi

[注-4]傑?福雷斯特( Jay Wright Forrester ),系統動力學( System Dynamics )創始人。1956年提出系統動力學( 另譯為系統動態學 ),建立因果環環相扣的系統回饋關係模型。協助人們具備系統動態學概念,從整體、動態的複雜環境中,做出較為適當的決策 。en.wikipedia.org/wiki/J

裏空間的敘事轉向

  • 滲透入侵:

通過 UC Berkeley 日前發布了迄今為止規模最大、最多樣化的開放駕駛動態影像數據集——《 BDD100K 》( Berkeley Deep Drive ),來進行繪畫滲透的行動。在自動駕駛系統部署到現實世界中後,人造感知系統如何避免錯誤( 甚至看似明顯的錯誤 )還不得而知、為了設計和測試潛在的演演算法,BAIR[注-1]的電腦視覺研究者想利用真實駕駛平臺收集數據中的所有信息,以使自動駕駛系統更加安全。這樣的數據有四個主要特點——大規模、多樣化、在街上採集、具有時間信息。數據多樣性對於測試感知演算法尤為重要,而目前的開放數據集只能覆蓋上述屬性的一部分、這也是《 BDD100K 》這個平臺的基礎背景[注-2]

利用像素愚弄電腦視覺已經不是新聞,在路標上貼上小貼紙來迷惑計算機視覺系統,使自動駕駛汽車轉向或者加速也見諸於報端。同樣利用柏克萊的一項「 訊息嵌入 」研究,來埋入這一些聲音和圖像訊息以達成本計畫之滲透行動。這項研究是通過自由軟體社羣——Mozilla 開源的 DeepSpeech「 語音-文本 」轉換軟體、將命令整合到了語音識別中,這項技術能夠刪除掉語音識別系統本應該聽到的聲音,並且將其替換為另一種聲音,這種聲音將被機器轉錄為不同的內容,而這種聲音是人耳幾乎聽不見的[注-3]。同理,亦能使用在圖像辨識上。

《 BDD100K 》( Berkeley Deep Drive )中開放的、含有標籤的街頭動態影像資料庫。

《 BDD100K 》( Berkeley Deep Drive )中開放的、含有標籤的街頭動態影像資料庫。

[注-1]

BAIR,Berkeley Artificial Intelligence Research Lab?加州大學柏克萊分校《 人工智慧實驗室 》縮寫。 Berkeley Artificial Intelligence Research Lab[注-2]UC Berkeley 發布了迄今為止規模最大、最多樣化的開放駕駛視頻數據集——BDD100K。 BDD100K: A Large-scale Diverse Driving Video Database

[注-3]

除了人類,有些聲音也在偷偷和語音助手說話。 除了人類,有些聲音也在偷偷和語音助手說話

再使用 Recurrent Neural Network( 循環神經網路,簡稱?RNN )、通過包覆感較強的建築投影( Mapping )、與相關可視化轉譯,生一張新文明身分的存在想像( 即本計畫中所稱的「 前文明意識網路」)。循環神經網路是一種在時間上深度的神經網路,常用於語音轉為文字或翻譯不同語言。 「 Recurrent 」已經點出其核心特徵,指系統的輸出會保留在網路里、和系統下一刻的輸入一起共同決定下一刻的輸出。也算一種體現動力學本質的概念,「 循環」可對應動力學系統的「 反饋」概念,能刻畫複雜的歷史依賴———即此刻的狀態包含上一刻的歷史,又是下一刻變化的依據。 ( RNN )是時序數據的首選網路,本計畫將通過這個邏輯來連結現存文明與未來文明


推薦閱讀:
查看原文 >>
相關文章