各位知友,大家好

今天下午,我們在北京組織了媒體溝通會,第一次有機會和媒體、花粉朋友們深入交流榮耀9X和麒麟810處理器。毫不誇張的說,麒麟810是一款名副其實的旗艦級晶元,採用目前最頂級7nm工藝、Cortex-A76架構,實現旗艦性能。自研達芬奇架構NPU,AI Benchmark跑分,超過32000分,全球第一高分。具備810晶元的9X也將全面達到甚至超越旗艦手機的水準。

「芯優一級壓死人」,領先7nm工藝。

攝影圈有句話,叫「底大一級壓死人」,我覺得有句話同樣適用於晶元領域,那就是「芯優一級壓死人」。

目前來說,7nm是業界最先進半導體製程技術。先進位程技術能帶來更高的晶體管密度,更快的速度,更強的性能,更低的漏電,以及更高的能效比。2018年,海思

率先發布業界首款7nm工藝製程晶元—麒麟980。同樣的,這一次,我們也迅速把7nm工藝落到了麒麟810晶元上。我們即將上市的9X搭載的就是7nm的麒麟810。

目前採用7nm工藝的處理器有四款,分別是麒麟980、驍龍855、A12,剩下一款就是麒麟810了。麒麟810的背後,是36個月+的研究與開發,1000+半導體設計與工藝專家,5000+工程驗證開發板的投入。我們早在2015年就啟動相關研究,一次投片+測試就是2000萬美金,一顆晶元從研究在量產的研發成本就高達數億美金。這些重型投入才讓810晶元用上7nm工藝。

甚至也可以說,在未來較長的一段時間內,最先進的工藝製程就是7nm!

旗艦級定製A76大核,硬核性能

先看手機的發動機——CPU。麒麟810採用當前最強的大核A76進行定製,至少量產的A77還未看到。再展開來看八核CPU,2顆最高頻率2.27GHz的基於Cortex-A76定製的高性能大核,以及6顆最高1.88GHz的Cortex-A55的高能效小核。一頓魔改帶來極致性能,相比於上一代8X,單核能力提升75%,多核能力提升40%。對比友商最新晶元,810在性能和能效上都有明顯優勢。

如上圖,針對移動體驗場景,創新的2+6大小核搭配根據不同應用進行靈活CPU資源調配,保障全程高性能的同時做到了良好的功耗表現。比如聽音樂的時候,開一個小核就夠了;玩重載遊戲時,4個小核+2個大核。

定製GPU核心,AI智能調度

麒麟810的GPU部分為Mali-G52核心,並且我們做了深度定製六核心,通過GFXBench測試,在1080P曼哈頓離屏、GPU能效0.8W兩項中都大幅度超越上一代。

支持麒麟Gaming+技術,包括系統級的AI調頻調度、GPU底層驅動升級及GPU負載優化、HD遊戲特效優化。減少重複指令及GPU負載,並加快CPU、GPU和內存之間的數據傳輸速度。達成提升遊戲畫質、清晰度、明暗對比度的目的,帶給遊戲玩家更暢快的遊戲體驗。

在晶元運作的最底層,採用了AI調頻調度技術,通過AI演算法和機器學習,精準預測系統每一幀的負載,準確性比傳統技術提升30%以上。具體操作則是,實時學習幀率、流暢度、和觸屏輸入變化,動態感知遊戲性能瓶頸,對CPU、GPU、DDR進項系統級融合調頻調度,使遊戲能夠穩定保持在高幀率。

如上圖,主要兩個方面的改進。第一個是,AI負載預測精準,系統給下一幀分配足夠頻率和核數,確保系統流暢。而傳統負載預測則會分配算力不足導致卡頓。第二個看後面這個節點,AI負載預測下一幀需要算力較少,故分配了更低的頻率和更少的核數,可減少能量損耗,助力手機長續航。

GPU Turbo 3.0 遊戲體驗新突破

榮耀祖傳GPU Turbo這次升級到3.0,通過圖形加速帶來更低的功耗和更快的毫秒級觸控響應。同時,我們支持的遊戲數量進一步提升到70+款。

從魔改的旗艦級A76大核CPU,到定製的MaliG52六核GPU,再到麒麟Gaming+及系統級AI調頻調度。同時,再輔以7nm最新製程工藝,還有Gamebench遊戲聯調。我們幾乎給9X配置了市面上最高的規格。這一切都只為在遊戲體驗上,有一個無法低調的突破。

自研達芬奇架構NPU,跑分全球第一

在馮·諾伊曼體系結構中,通用計算機的計算部分都交由CPU(Central Processing Unit,縮寫:CPU)來完成。隨著喬布斯和比爾蓋茨普及了圖形化界面,人們發現用通用的中央處理器(CPU)難以處理複雜圖像渲染計算。於是乎GPU(Graphics Processing Unit,縮寫:GPU)誕生了。GPU是專為執行複雜的數學和幾何計算而設計的,這些計算是圖形渲染所必需的。

到了移動互聯網時代,伴隨人臉識別、拍照特效等的普及,各類AI演算法愈發常用。人工神經網路的處理速度成為了瓶頸。一個高效的神經網路引擎迫在眉睫。因此,我們在2017年就率先推出了NPU(Neural-network Process Unit,縮寫:NPU),在照片、遊戲、AR等方面,為用戶帶來更流暢的體驗。現在我們在手機端又進行了升級——推出華為自研的達芬奇架構NPU。

達芬奇架構是全新的自研AI計算架構,針對AI計算特點進行設計。不同於二維運算模式,達芬奇架構以高性能的3DCube計算引擎為基礎,針對矩陣運算進行加速,大幅提高單位功耗下的AI算力,充分激發端側AI的運算潛能。神經網路運算數據為3D格式,需要處理單元的創新,NPU在處理AI任務時,性能和能效遠高於CPU和GPU。

根據蘇黎世聯邦理工學院(ETH)發布的AI Benchmark跑分,超過32000分,全球第一高分。

接下來,我看看最常見數據格式在常用模型下的表現。

1)在FP16數據格式下,相比於驍龍855,麒麟810在VGG、Resnet34等多個演算法模型中,有較高的性能和能效優勢。

2)低比特量化是當下人工智慧研究的重點之一,如何在低比特量化的同時,最大化保留計算精度,是各晶元廠商重點投入解決的問題之一。在INT8數據格式下,對比855,麒麟810精度保留更好,例如右邊的圖,在超分原圖的時候,855在鳥的脖子處有大量的計算精度丟失進而導致斑點。而麒麟810則更好的保留了精度。

再回到這個超分性能對比,在保證超分效果的同時,麒麟810耗時1.7s,Q855在同一張圖上耗費了2.4s。

知友們應該都沒見過麒麟810的真容,曬兩張圖給大家展示下,旗艦晶元麒麟810本體的真容。旗艦級的晶元用在旗艦配置的手機上,榮耀9X真旗艦手機。

7月23號,註定無法低調的9X在西安與大家見面。更多關於榮耀9X的信息,敬請大家期待西安發布會。

推薦閱讀:

相关文章