在經過動蕩不安的 2018 年,以及表現欠佳的財季發布之後,NVIDIA 在 2019 年的首次 GTC 上宣示了怎樣的內容,相當值得我們關注。

而縱觀整場GTC,過去幾年總有震憾性發布、而被外界稱為 "AI核彈大會" 業界年度大事,在今年卻似乎沒有太多重磅發布,反而更強調於挖掘既有架構潛力,並加速擴大整體生態實力。

去年因為礦災,導致產品嚴重庫存,加上消費端市場與伺服器端市場需求低於預期,讓 NVIDIA 的股價從將近 300 美元,市值近 1800 億美元,至今下挫近半,雖然不少人認為這隻一直以來在 AI 核心技術與娛樂繪圖領域發光發熱的金雞母或將就此失去光芒,但做為全球最聰明的公司之一,只要計算的需求不退,AI 的發展仍持續發燒,那麼對於 NVIDIA 而言,這些發展過程的波折並不足以拖累其發展腳步。

(來源:DeepTech)

然而 NVIDIA 本身技術優勢雖在,但值得注意的是,從 2019 年開始,挑戰只會越來越嚴苛,其最大對手 AMD 在 CPU 市場站穩腳步之後,也重新收拾起荒蕪的 GPU 產品線,欲力圖振作,並即將在 2019 年 GDC(Game Developers Conference) 上發表最新繪圖架構與技術;另一方面,英特爾亦同樣重回 GPU 戰場,並要同時在計算與娛樂繪圖市場向 NVIDIA 發起挑戰,並同樣要在 GDC 上揭露其即將在 2020 年面世的最新 GPU 架構布局。

當然,原本市場也預期 NVIDIA 在本次 GTC 上將會提前揭露應對這些競爭對手的核心武器,也就是 7nm 的產品布局,不過可惜的是,NVIDIA 並未發布針對對手產品布局的反應或者是下一代產品,而是專註於 AI 主題,並最大化的去挖掘 RTX 繪圖架構的繪圖與計算潛力。

產品布局更新以伺服器計算方案為主

在 NVIDIA 的主場 GTC 上,黃仁勛依舊維持一貫的舞颱風格,皮衣皮褲則是感覺更緊繃了些。

首先進入主題,黃仁勛再次對過去在計算方面的成績又強調了一次,包括在各種行業中的科學計算、高效率的超級計算機,還有各種針對計算環境的努力,都和 NVIDIA 脫不了干係。

而計算並不只是晶元設計,而是整套的生態環境,黃仁勛在此也進入了主題,他帶出了這次最重要的主題之一,也就是 CUDA-X 加速計算環境,通過這個一致性的環境,讓 NVIDIA 的所有產品都能夠得到軟體加速的最大好處,而且能夠大大的簡化開發的流程。

就目前的計算架構而言,大部分都是軟體定義的編程工作,如果接入,並取用計算性能的介面能夠最簡化,那麼就能極大的加速整個軟體,或者是應用的開發工作。

最聰明的作法就是用最少的工作流程來達到最大的工作成效,而這也是黃仁勛一再強調的,買越多省越多,如果能夠大大的加速工作的進行,增加公司的競爭力,這些硬體的支出是相對低成本的。

圖|NVIDIA CUDA-X GPU 加速計算「大軍」(來源:DeepTech)

黃仁勛也提到,關於架構方面的定義,當計算已經走到現代,架構定義了很多計算的方式,而也決定了未來效能的擴展,以及應用的廣度。

而黃仁勛也逗趣的用每個字的開頭來去形容他所描述的單一架構可編程擴展性的計算方式,也就是 PRADA(PRogrammable Acceleration Domains Architecture)。

圖|今年的 GTC 關鍵詞「PRADA」(來源:DeepTech)

接下來,黃仁勛依舊把 RTX 的光線追蹤繪圖效果當作寶貝再度秀了一波,他利用電腦繪圖和真實照片進行了對比,顯示出目前通過 RTX 繪圖架構,已經可以做到以假亂真的地步。當然,這部分其實沒有太新的東西,但值得注意的是,NVIDIA 所展示的軟體效果相較於前幾次 GTC 的效果已經更穩定,調整方式也更成熟。

圖|RTX powerred 的實時光線追蹤(來源:DeepTech)

而提到 RTX 圖形架構帶來的繪圖效果,黃仁勛也再度把已經炒過幾次,有點冷掉的 RTX 繪圖晶元冷飯再度拿出舞台上炒熱,不過這次更強調的是彈性可變動的光線著色能力,以及更大範圍、更多元材質的繪圖能力與軟體支持功能。

黃仁勛也再度提到 Tensor Core 在娛樂繪圖卡中能夠肩負的工作,就是通過深度學習來降低繪圖工作的負載,通過減少計算的圖素數量,提高繪圖性能表現。

另一方面,黃仁勛也提到,包含 Unreal 在內的眾多遊戲引擎供應商也已經把光線追蹤的能力整合進去,並且作為默認的功能,這也代表未來圖靈架構以及其代表的光線追蹤優勢能力將可更廣泛的被遊戲玩家所看到,在不遠的將來就可擺脫前幾個月空有強大光線追蹤硬體,卻沒有光線追蹤遊戲軟體可玩的窘況。

不僅如此,最新的 NVIDIA RTX 圖形技術也將走出僅幫助 PC 遊戲創建逼真畫面的邊界,幫助塑造未來的汽車設計。Unity Technologies 和 Nvidia 宣布建立新的合作夥伴關係,將創建一個增強的軟體平台,為汽車設計師、製造商和廣告客戶帶來實時光線跟蹤技術和高解析度 3D 渲染。

接下來,黃仁勛講了點歷史,那就是 20 年前首款真正 3D 加速遊戲,也就是 ID 軟體公司的 Quake 遊戲的面世,徹底改變了遊戲產業的景象,也改變了遊戲繪圖硬體的發展,自此之後,所遊戲繪圖硬體的 3D 化成為不可逆的方向。為了紀念這個大事件,NVIDIA 團對利用公開的 Quacke 源碼打造出一個完全光線追蹤的版本,通過這個遊戲版本的執行,讓在場參與者發思古之幽情的同時,也看到通過最新繪圖技術的進展可以對老東西造成多麼深遠的影響。

圖|圖靈 RTX 對 Quake 的支撐(來源:DeepTech)

另外,針對創造者而言,3D 化的加速功能也改變了整個圖像、影像產業的發展,諸多出名的多媒體編輯程序已經先後加入 GPU 計算加速的能力,並通過該功能大大的加速了內容創作的速度與品質呈現。

而通過最新 RTX 世代繪圖技術帶來的 TensorCore 以及光線追蹤計算單元,是在 GPU 的基礎之上針對光線與物理等現象的模擬或創作達到更好的效果。而相較起過去使用純粹 CPU 的計算方式,不只成本更低,效率更高,而且效果更好。

圖| CPU vs. RTX 的 Benchmarking data(來源:DeepTech)

「買越多省越多」黃仁勛又自信滿滿的講了這句話。不過,今年這句話又多了個後綴:「But all the RTX technology are free for you to use.」(而所有的 RTX 技術都是免費供你們使用。)

圖|RTX 受到了 100 萬建築師、300 萬設計師、300 萬 3D 設計師和 200 萬 M&E 專業人士的支持(來源:DeepTech)

圖|GPU 也同時改變了全球電影生態的格局,通過更好的工具,讓電影特效的建立可以用更低成本並以更好的效果呈現(來源:DeepTech)

圖|黃仁勛也展示了 OMNIVERSE 這個 3D 協同創作工具,讓美術從建模、貼材質,到空間設計等原本需要不同軟體與工作流程的內容可以同時進行,大大的加速了美術工作的效率(來源:DeepTech)

黃仁勛也把過去的雲端遊戲平台再度提出來,畢竟大部份的遊戲玩家還是缺乏強大的平台來進行遊戲,而顯卡和 CPU 等相關的成本還是太高,降低成本就變得十分重要。黃仁勛表示這次不是類似過去的網路隨選遊戲平台,而是真正的雲端 GeForce 繪圖平台,即 GeForce NetWork。目前軟銀與 LG U+已經加入到這個服務的聯盟之中,並將在各地提供服務,玩家可以在網路商店上購買遊戲,並通過這個雲端平台來執行,通過未來的低時延 5G 技術,我們甚至可以在手機上玩最高端的 PC 遊戲,而且畫面效果毫不打折。

圖|流媒體視頻服務領域,NVIDIA 與日本軟銀集團在日本構建合作夥伴關係,與 LG 在韓國構建合作夥伴關係(來源:DeepTech)

圖|黃仁勛宣布推出 RTX Server,擁有 40 個圖靈 GPU 和多達 320 個虛擬化 GPU,用於渲染、虛擬化和雲遊戲(來源:DeepTech)

圖像技術之後,GTC 的第二大主題——AI 登場。在這個環節開始,黃仁勛首先提到了數據科學的迅猛發展。近年來,數據科學是計算機科學領域發展最快的領域,黃仁勛稱之為人類新發現的又一支柱。NVIDIA 為了幫助市場上超過三百萬個數據科學家解決數據問題,推出了CUDA X,亞馬遜、谷歌、微軟都已經有使用案例。CUDA X 可以通過NGX 平台免費獲得。

(來源:DeepTech)

在這個段落,黃仁勛提到,數據科學研究帶來的數據計算需求,也是計算需求成長最快的市場領域,包括各大學的科研、醫藥、材料等,還有各種 IoT 的感測器的廣泛應用,創造的廣大的計算需求,這些都需要更有效率的計算方式。要如何應對這些具備龐大量級的數據計算需求,AI,也就是常見的深度學習或機器學習等則是很好的武器。

通過對大量數據的處理、計算,並經過良好的預測模型,最終經過推理的階段,就可以形成一個針對大量數據計算而得出的合理預測,這個預測可以推測出包含醫藥開發、社會現象觀察、自然科學、物理、天文等各種領域的研究,而這些都可以在 CUDA-X 的生態下達成。

通過對基礎計算架構、軟體平台、計算模型、不同雲服務商的計算服務工作的整合,NVIDIA 為數據研究科學家提供了最好的一致性平台,讓這些數據研究與分析工作可以根據數據規模的大小,在不同的平台上面達成、轉移或者是建立。

最後,黃仁勛也強調了 TensorCore 在 CUDA-X 生態中所扮演的重要角色,這也代表了,NVIDIA 希望這些 AI 工作,尤其是偏推理的部份,能夠更快的轉移到 TensorCore 架構上,對 NVIDIA 而言,TensorCore 會成為未來在專業計算中極為重要的角色,甚至不下於原有的 GPU 架構。

圖|NVIDIA CUDA-X AI 生態系統。Google,Microsoft、AWS、Accenture 和 Databricks 支持 CUDA-X AI 採用 GPU 加速數據分析,深度學習和機器學習。如今,開發晶元不構建配套生態系統幾乎等於徒勞(來源:DeepTech)

而談到深度學習與雲端 AI 計算,黃仁勛也強調,不同數據精度的支持是非常重要的,畢竟在 AI 環境中所需要處理的數據型態、科技領域,會產生各種不同的數據計算需求,所以某些公司強調的特定精度的效率優勢其實並不可靠,業界看的是整體,如何能夠兼顧最大量的數據處理類型與規模需求,才能讓你的計算架構被最大範圍的應用到市場當中。

圖|黃仁勛宣布 CLARA AI 工具包,可用於構建、管理、部署放射學應用程序,幫助注釋圖像。這是 AI 在醫學上最激動人心的用途之一(來源:DeepTech)

CLARA AI 則是另一個 NVIDIA 提供的重量級 AI 工具,它提供了預先定義好的模型可供使用,當研究者或開發者使用這些模型時,會加入自己的數據來進一步訓練,並更產生更精準的結果,而 NVIDIA 則是利用這個過程讓預定義的模型更為精準,同時也加速最終模型的產生速度,並直接提供給開發者,作為雙贏的經營模式,可大幅加速數據分析工作的進行,加速產業的發展。

圖|利用 XGBoost 可以快速的對大量數據進行深度學習,並同時利用視覺化工具顯示出結果,同時通過深度學習,可以對數據的未來進行預測,而這在傳統的數據處理方式是完全不可能達到的。(來源:DeepTech)

圖|NVIDIA 推出專為數據科學設計的工作站,戴爾、聯想、惠普將與其合作開發,運行兩個 Quadri RTX 8000(來源:DeepTech)

但數據科學的需求並不僅僅是這麼簡單,甚至可以說處於 supercomputer 和 hyperscalar 之間。這正是 NVIDIA 宣布推出 T4 GPU 用於 Data Science Server,每台伺服器都有 4 個 T4 GPU,並與 Mellanox 互連。

圖|RAPIDS 工具(來源:DeepTech)

一同亮相的還有 RAPIDS 工具。通過 RAPIDS 工具,可以串連不同的雲端計算平台共同處理一件計算工作,形成一個虛擬的超大型超級計算機,這種工具的發布甚至可能改變未來數據中心的設計方式。通過高效能網路,可以串連不同地方的數據中心,形成巨大的計算串列,而這也是 NVIDIA 之所以要收購 Mellanox 的最大原因。

Microsoft Azure 機器學習(AML)服務是第一個集成 RAPIDS 的主要雲平台,RAPIDS 是 NVIDIA CUDA-X AI 的關鍵組件。通過訪問 RAPIDS 開源庫庫,數據科學家可以使用 AML 服務上的 NVIDIA GPU 以極快的速度進行預測分析。

根據反饋,使用 RAPIDS 的企業可以將培訓 AI 模型所需的時間減少多達 20 倍,將培訓時間從數天減少到數小時或從數小時減少到數分鐘,具體取決於數據集大小。而這也是 RAPIDS 首次本地集成到雲數據科學平台。

圖|NVIDIA 將以 69 億美元的價格收購 Mellanox,Mellanox CEO 作為重磅嘉賓上台亮相(來源:DeepTech)

圖|本次 GTC 黃仁勛最經典 pose 誕生(來源:DeepTech)

在 GTC 接近尾聲之時,99 美元的 JETSON NANO 似乎承擔了「one more thing」的驚喜。這個響應邊緣計算大潮而誕生的產物,是一個應用於機器人 AI開發的計算機,最低功耗可至 5w,看起來 NVIDIA 是要搶樹莓派的飯碗了。

圖|NVIDIA DRIVE Constellation?(來源:DeepTech)

自動駕駛作為這兩年 GTC 的重頭戲,今年 NVIDIA 繼續宣布生態圈的擴大和穩固,與 Toyota 的合作成為重點,雙方合作涉及自動駕駛的開發、訓練和測試三大方面,基於 NVIDIA 這次推出的 NVIDIA DRIVE Constellation?自動駕駛汽車模擬平台,基於雲可以在數百萬英里的範圍內驅動自動駕駛在虛擬世界中的測試和訓練,涵蓋從常規駕駛到罕見和危險情況各種情景,而且和現實世界相比,兼具更高效率、成本效益和安全性。

圖|NVIDIA DRIVE Constellation?的首個合作對向是Toyota(來源:DeepTech)

求穩為主,持續強調身為 AI 基礎生態建設的核心價值

雖然挑戰嚴苛,但 NVIDIA 仍然堅持自己的步伐。回顧本次 GTC ,我們也沒有看到太激進的消息,或者是手足無措的慌亂感。取而代之的是,NVIDIA 還是一貫的以核心技術作為開場,並且進一步強調自家 GPU 與 AI 計算在技術與應用生態上的優勢。

看來是老生常談?其實沒有這麼簡單。AI 雖然已經從概念開始大量轉換成實際的市場模式,但仍有許多未知的市場空間需要開拓,而 NVIDIA 自詡為 AI 生態的開拓者,其在基礎理論研究,以及如何更好的發揮 GPU 計算的優勢等方向,仍然持續投入了龐大的研究人力,並且在全球範圍建立了多家研究院。從基礎理論、編程框架、晶元架構、圖學、計算學等各個領域進行研究,並取得了相當可觀的成果,其為全球開發者引路的決心其實相當令人佩服。

雖然就整體市場風向來看,中國遊戲市場的萎縮,以及雲端計算基礎建設需求成長停滯,都是讓 NVIDIA 跌一大跤的關鍵原因,但 NVIDIA 在包含遊戲繪圖與雲計算的平台產品方面,都還是推出了新產品,其中 RTX 產品線已經全線上陣,其相較於前代較高的性能表現,以及獨家的硬體光線追蹤能力,使其在市場上具備獨一無二的地位。

而作為應對前陣子 AMD 推出的 7nm 主流卡的競爭,並瞄準主流市場甜點定位的 GTX1660 產品,甚至更低端的 GTX1650 產品,也以全新的圖靈架構上陣,雖然缺了光線追蹤,但是在性能方面則是不打折扣。通過這些產品布局,NVIDIA 繼續維持其在市場上的壟斷地位,根據 Jon Peddie 的調研報告,NVIDIA 在最新一季的獨立顯卡市佔數據中,依舊維持壟斷等級的高水平,達到 81.2%,狠狠的碾壓了 AMD。

作為整個 AI 生態鏈最高層的供應商,以及作為實現 AI 算力目前被應用的最廣的基礎設施供應者,NVIDIA 的一舉一動仍然受到極大的關注,即便壓力山大,NVIDIA 仍然一貫穩紮穩打,雖然讓 GTC 少了些激情,但也可得見 NVIDIA 的穩重,即便面對市場壓力,仍然沒有慌亂的跡象。

幕後花絮:首席科學家 Bill Dally 揭露研究院布局與最新研究成果

值得一提的是,本次 GTC 大會期間,NVIDIA 首席科學家 Bill Dally 也罕見亮相,向媒體系統宣布了 NVIDIA 研究院目前的布局。

他介紹道,NVIDIA 研究院目前在全球各地共有 175 名全職人員,其使命是,為未來的成功埋下種子,發展科技,同時也為 NVIDIA 帶來積極地影響。

(來源:DeepTech)

Bill Dally 從兩個大方面構建 AI 研究,從基礎層來看,包括編程系統、networks、架構、VLSI、circuits,從應用層來看,包括圖像、概念學習、機器人、應用型深度學習研究等。在剛剛過去的 2018 年,NVIDIA 研究院產出了 104 篇學術出版物,51 項專利應用、12 個開源軟體包,一些學術論文已經被 ICLR、CVPR、NeurIPS、ECCV 等業內頂會接收。

其中的技術亮點研究包括對 RTX、NVswitch、CuDnn 的應用,Cnn Image Inpainting、Noise-to-Noise Denoising、Progressive Gan(漸進式生成式對抗神經網路)等相關的研究。同樣非常值得關注的是 NV 今年建立的西雅圖機器人實驗室,這個實驗室正在致力於讓新一代機器人能夠獨立於人類工作,有望真正改變製造業、醫療等領域。

(來源:DeepTech)

在當天的媒體溝通會上,NVIDIA 研究團隊也帶來了其最新的 Gan 研究——GauGAN。在現場的演示中,這款演算法以極逼真的筆法幾秒鐘之內就能夠將簡筆塗鴉生成了一張張風格各異的風景圖片,該最新研究已經被 CVPR 2019 接收為 Oral Presentation。

(來源:DeepTech)

在現場展示環節,NVIDIA 也為本屆 GTC 的「higher education session」選出了美國高校的 5 大 AI 亮點研究,分別是:

1、勞倫斯伯克利國家實驗室的氣候分析大規模計算

2、UC berkerly 應用於機器人的深度學習

3、伊利諾依大學香檳分校的生物分子模擬實驗

4、UC Santa Cruz 將 AI 應用於天體物理學的研究

5、北卡羅來納大學運用 AI 開發新葯的研究

在自動駕駛領域,NVIDIA 也給出了本屆 GTC 5 大亮點研究,其中 AutoX 和圖森未來都是中國企業:

1、AutoX 改變貨物配送的現狀

2、圖森未來在自動駕駛感測上的突破

3、ZooX 在視覺識別上的高精度表現

4、豐田研究院在自動駕駛方面的研究進展

5、沃爾沃利用視覺識別和深度學習幫助車主更好找到車位

接下來幾天,DeepTech 作為 GTC 受邀媒體,將發回更多重要現場報道,敬請關注。


推薦閱讀:
相关文章