2020 年 10 月 22 日,華為發布麒麟 9000 晶元,採用 5nm 製程,具有 153 億個晶體管,擁有 8 核 CPU(1 個 A77 核心 3.13 GHz,3 個 A77 核心 2.54 GHz,4 個 A55 核心 2.05 GHz),24 核 Mali-G78 GPU,2 大核 + 1 小核 NPU,內置巴龍 5000 基帶,ISP 6.0 支持 LPDDR4X/5 存儲,如何評價這顆全新晶元?


目前的功耗測試的相關我放在的末尾。

今晚上一共發布了3款處理器:麒麟9000、麒麟9000E、麒麟990E。

先說最次的麒麟990E:麒麟990 5G的GPU減配版。

這款處理器和麒麟990 5G唯一的區別是:16核G76 GPU縮減為14核G76 GPU。其他完全一樣。

關於這款晶元來說,沒啥太多好說的。麒麟990 5G上市一年,具體什麼表現大家都是很瞭解的了。

有一種說法是目前晶元稀缺,用一片少一片,因此這種體質相對較差的,就屏蔽部分核心拿出來用,以前的話是直接處理掉的。

特殊時期,理解一下。

目前用在這貨上,這個看京東詳情頁除了處理器其他描述和Mate30Pro完全一樣(包括拍照、充電等等),有說法是去A化後的產物。總之看價格吧。

華為 HUAWEI Mate 30E Pro 5G麒麟990E SoC晶元 雙4000京東¥ 9999.00去購買?

然後說說麒麟9000和麒麟9000E

麒麟9000E是麒麟9000的略微降配版,應該也是屏蔽核心的做法,NPU從2大核1小核縮減為1大核1小核,GPU縮減2個核心。

麒麟9000E用在Mate40標準版上,目前還不支持預訂。

而麒麟9000,可以說是目前為止,取代驍龍865暫時登頂安卓處理器排行榜,目前為榜首。

目前用在這三個上面:Mate40Pro、Mate40Pro+、Mate40保時捷設計。

華為 HUAWEI Mate 40 Pro麒麟9000 SoC晶元 超感知徠卡京東¥ 9999.00去購買?

華為 HUAWEI Mate 40 Pro+麒麟9000 SoC晶元 超感知徠京東¥ 9999.00去購買?

華為 HUAWEI Mate 40 RS 保時捷設計麒麟9000晶元 超感京東¥ 99999.00去購買?

一、CPU部分

架構:

整體的配置和驍龍865類似,而大中小核(相對865)都有一定程度的提頻,配合5nm製程帶來的性能提升,最終做到性能比865Plus強10%,能效高25%。

很可惜的是由於制裁原因,麒麟9000沒法用上最新的X1/A78架構,不過高頻A77配合5nm,也不錯了。

二、GPU:此次最大升級點

架構:Mali G78 MP24 759Mhz

據傳:默認模式為500Mhz

這次華為史無前例的將GPU規格堆滿(G78最高可以支持到堆24個核),而超大規模的GPU帶來的就是性能和能效的巨大提升。

官方宣稱能效比驍龍865+強50%,性能跑分(GFXbench 5.0 1440P 阿茲特克 Vulkan high tier offscreen)高52%,是非常大的領先了。

如果參考3DMark新出的Wild Life跑分的話,麒麟9000跑出了5000分的高分,相比3800左右的驍龍865有明顯優勢,基本持平超頻到915Mhz的驍龍865(代價是發熱嚴重超出手機承受能力)

總之,這次麒麟9000的GPU可以說是最大的亮點了。

左:P40Pro(K995) 右:M40P(K9000)
驍龍865@587Mhz(默認最高頻率)跑分
驍龍865@915Mhz(超頻)跑分

而目前找得到的GFXbench 離屏成績

  • 在默認模式下,也許是為了控制發熱和續航,麒麟9000的性能控制在略超驍龍865+的水平
  • 在性能模式下,麒麟9000的性能持平/略超驍龍865超頻至875Mhz。
  • 麒麟9000相比麒麟990提升巨大,曼哈頓3.1離屏幀數提升有50%之多。

三、其他

基帶部分,此次憑藉5nm成功將巴龍5000集成到處理器內部,不出意外的話麒麟9000也支持毫米波了。

全新升級的NPU、ISP等。支持LPDDR5。這些就不再贅述了。


關於目前的烤雞測試

1、瑪麗烤madd vec4 fp32效率在95%上下。而之前有個10W功耗的算下來是94%的效率,算力符合。

2、烤雞測試的這個功率,這只是alu功率,只是做基本×+運算的功率,跟圖形功率沒有特定聯繫(gpu不只是alu)比如高通前幾代拿這個測試功率都很高,烤雞alu利用率有80+%,實際跑圖形測試alu利用率只有60+%…,這就可以解釋我之前說的:我那855跑曼哈頓3.1功率5W不到,而烤雞遠不止5W。而麒麟這邊也是一樣,烤雞10W,跑GFXbench以及實際遊戲的時候肯定是沒有這麼高了

3、那個據傳是更新系統之後跑的烤機圖,峯值功耗9W,逐漸降低到5.6W。

之前不是傳聞性能模式是759Mhz嗎,根據理論計算759mhz*24核*每核32alu*2=1165.824gflops

圖裡面顯示峯值1055.1 GFLOPS,基本上相差不大(考慮到效率不是100%),所以有可能並沒有降低最高頻率而是烤久了溫控降頻

關於這方面我也是一知半解。持續學習中。


更新下:麒麟新一代5G晶元是我最關心的點。

1. 為什麼要有兩個版本:9000和9000E ?

看發布會PPT,9000E比9000少了2個GPU核心,但仍然有誇張的22個,NPU核心也少了一個。這樣的話,雖然配置略有差別,但定位、性能其實都拉不開。這與麒麟990 5G和麒麟985之間的巨大差距是完全不同的。

為什麼要出2個接近的核心?

有可能是因為5nm良率問題(TSMC 背鍋),需要屏蔽壞核心。還有可能是制裁令下,華為為了多拿到晶元存貨,把一部分良率不足的die也挑了出來(只是猜測),做成了麒麟9000E。不過按照微弱的區別,麒麟9000E的性能完全不需要擔心。

另外,從麒麟9000的153億晶體管來看,還是大面積die,不知道成本怎麼樣(看最終國行定價),5nm晶元12英寸一片已經漲到17000多美元了,對比7nm只有9000多美元。

2. 9000E的工藝是什麼?

已經確認是TSMC N5,Mate 40採用。後續榮耀的機型,平板等等可能也會採用這一款Soc,取決於有多少存量。

3. 麒麟9000系列產量如何?

最關心的產量問題沒透漏,可能確實不樂觀吧。

最後,《dream it possible》,致敬!


亮點不說了,這晶元發布得很讓人心疼。

為什麼會發布三個檔次的晶元?

因為往後就沒麒麟晶元用了,目測華為和榮耀之後發布的中高端系列手機,都得靠這三款晶元撐著,起碼華為是這樣在準備最壞的情況的。所以990e大概率很快就會下放給榮耀和華為Nova等系列,可能會接替8系列晶元的生態位,承擔麒麟830的角色。

為什麼9000的GPU要把料堆到極致?

哪怕這可能會讓發熱問題沒那麼好處理,不夠均衡,還不是為了在之前臺積電還能供貨的時候趕出來能趕的最強晶元,來維持明年的旗艦機在處理器上依舊能打。

但凡對晶元和手機有一些瞭解的,都能從這場發布會的細節中看出來「艱難」兩個字。

如果華為是正常的狀況,其實我會勸預算不太夠不急著買手機的朋友做個等等黨,因為這些晶元絕對會下放給之後的系列新品,990減配的990e其實也足夠好足夠用,只是沒那麼極致罷了。

可惜沒有如果,所以我想說,大家想買華為的還是趕緊買吧,早買早享受,買一個少一個。即便是搭配990e的mate30E pro在目前和明年也依舊算得上高端機。

扯愛國有點沒意思,但是對華為這個品牌有感情或者不想離開華為生態EMUI系統,有換機需求的朋友,真的支持一下華為吧。

幫華為一起,撐過日蝕的至暗時刻!

華為mate40 Pro 5G手機 素皮綠色 全網通 8G+256G(碎京東¥ 8199.00去購買?


長文預警,持續更新

一句話概括就是,目前安卓陣營頂級的性能,但由於調度不善導致的表現並不理想,不妨礙這是個底子很好的處理器,可以等一波完全體,後續華為可以通過OTA推送,限制一下麒麟9000的頻率,將會獲得非常不錯的體驗,大於等於驍龍865。但是不出意外,應該不會強過後續的驍龍875。

發布會當天正巧有事兒,我沒有看,之後看了很多大佬的文章,我當時還是很沸騰的,其中最大的一點就是GPU的提升,相比於驍龍865提升52%,這在歷史上是絕無僅有的,大多數時刻,華為的麒麟處理器,相對於頭半年發布的高通驍龍處理器,尚且在GPU上往往存在弱勢,而這次一反常態,如果達到其宣稱的52%優勢,那麼我有理由認為,麒麟9000在GPU上肯定能超過驍龍875,而875相對於麒麟9000即便有著四個月的時間差,可能也只有在CPU表現上更好,所以兩者我認為是可以互有勝負的。然而一天的時間不到反轉太快,我既然當時沒有選擇出來寫個什麼東西,發表一下自己的看法,乾脆就再等一等,看看還有沒有後續的翻轉。

今年的5nm處理器命運多舛,先是蘋果a14擠牙膏,之後麒麟9000翻車,按道理來講,這兩家的晶元IC技術都是業內頂級的,不太容易同時翻車,其中最大的可能應該就是TSMC5納米工藝的問題。我頭半年就說過,這是一個能效和密度工藝,而不是高頻工藝,高頻率帶來的高熱密度是指數性的,對CPU的影響非常大。因此5nm就應該拋棄Finfet選擇GAA,IC廠正確打開方式應該是大規模低頻率。一個沒有被深度打磨的節點,頻率/功耗曲線是註定不好看的。intel在此處開心的拍起了肚皮,

由於我不是專業人士,但是評價一個菜好不好喫,不一定非得要成為一個廚子。我只給出幾點猜想,但是確實沒有能力去驗證,希望大家批評和指正。

首先值得提出的一項是,即便麒麟9000確實存在功耗不好看,但這仍然是一款我心目中的好處理器,至少從規模上來看,華為是有誠意的,是想做出一款優秀的處理器的。而從實際表現來講,麒麟9000仍然是目前安卓陣營最強的處理器,沒錯,我認為它比驍龍865系列要強一些。

首先是CPU部分,採用了與驍龍865同樣架構的A77架構,在GB5.0跑分中,單核分數為1020,對比驍龍865,單核性能強9.7%。其中頻率提高為10%,可以看出兩者IPC基本一致,緩存結構上麒麟9000這邊暫時未知,而驍龍865那邊應該已經是「滿血」A77了,如果不出意外,兩者應該是同樣的緩存結構。

麒麟9000的最高主頻定的有點高了,A77和A76是同樣的流水線結構,ARM官方對這兩個架構的設計本身都是在3GHz以內的,而高通和海思甚至超越了ARM的「目標」,3.13GHz既不是A77的甜品,也不是5nm的甜品,不出意外地講,這個頻率之下,收益和付出明顯是不成比例的,不僅是麒麟9000系列,甚至之前的驍龍865+,我也不是很滿意,為了10%不到的性能而需要消耗額外20%的功耗,這無疑得不償失,我認為目前所有的ARM移動處理器在內,最高頻率都不應該高於3GHz,這個論斷不是說基於某一個什麼規則或者定理,而是經過大量處理器的實測經驗推導。當然對於蘋果的處理器另當別論,比如蘋果a13明明可以在2GHz得到性能與功耗的雙重勝利,偏偏要選擇為了30%的性能而浪費了150%的功耗,難以理解。

重頭戲在GPU上。

G78MC24是讓我震驚的,希望之後的dieshot可以解析出麒麟9000的GPU部分,究竟有多大的面積。這個規格直接達到了g78的上限,在歷史上同樣是絕無僅有的。

回顧一下歷史,華為海思k3v2採用了gc4000的GPU,暫且不表。

麒麟910 mali T450mp4(這一代的架構沒有統一渲染管線,頂點和像素填充是分開的,代表機型mate2)

麒麟920 /925/928 mali T628mp4 (624)對比更早的exynos5420為mali T628mp6

麒麟930/935 mali T628mp4,沒變

麒麟950/955 mali T880mp4,跳過mali7系,性能大幅提升,但是和同時期的安卓旗艦驍龍820比,差距還有很大。同期exynos8890為880mp12(自以為這一代非常可惜,如果GPU激進一點兒加到MP8,頻率低點,那麼950將有能力和驍龍820掰掰手腕,雖然即使這樣,GPU的性能和能效仍然不及,但是CPU是明顯有優勢的,很可惜並沒有,8890做了如上實驗,880mp12,然而在性能和功耗方面,仍然雙輸adr530,可見adr5系時代,高通的GPU相當強勢)

麒麟960 mali G71mp8,我認為麒麟9000最像這一款,在峯值性能上是明顯超過半年前的高通旗艦,可惜功耗高了。同期exynos8895為G71mp20。

麒麟970 mali G72mp12,exynos9810是G72mp18

麒麟980 G76mp10

麒麟990 G76mp16

麒麟9000 G78 mp24

這裡頭除了麒麟970到麒麟980,MPcore數量減少了,其他都是增加的。但是G76對於G72的規模是翻倍的,也就是說G76mp10其實相當於G72mp20,所以還是增加的,

多核低頻,誰不想啊。

G78mc24就是典型的多核,甚至已經多到了上限,但是頻率卻並不低。我猜這個GPU應該設置在500MHz以內,在這個頻率之下性能不弱於驍龍865,且有能耗的優勢,對於目前的麒麟9000來說,這個目標顯然是夠用的。因為目前所有的G77 G57架構,頻率基本都在700MHz附近或以上。可以從天璣820,麒麟820,麒麟985,天璣1000推斷一下,用曼哈頓3.1 說事。

天璣1000+ G77MC9 836MHz 81fps/5.4w

天璣820 G57MC5 900MHz 55fps/3.3w

麒麟820 G57MC6 804MHz 47fps/3.3w

天璣1000L G77MC7 695MHz 55fps/2.98w

麒麟985 G77MC8 804MHz 55fps/3.45w

??大家都是臺積電N7,mtk的效率顯著高於麒麟,按道理講,這個規格下不至於內存帶寬成為瓶頸,比較費解。

這裡面要先確定一個共識,性能隨規模正比例變化,功耗隨規模正比例變化,而性能隨頻率按高次冪變化。

所以我覺得這邏輯是沒有問題的,道理上講G78MC24在804MHz時,功耗10瓦,性能應該在曼哈頓3.1 160fps左右。

而實際上麒麟9000的GPU性能沒有達到這個數字,但是功耗達到了。這還是5納米對比7納米的情況下,換句話說,難道5納米在同性能下比7納米的功耗還要大?

而且是沒有考慮g78,相對於g77區別。要知道g78相比於g77是有一定的能效優勢的。

有一種可能是熱密度導致的,但這也只會決定功耗,並不會影響性能,尤其是GPU這種並發度很高的硬體。(這麼大規模下,alu利用率也能達到94%以上,作為對比,adreno640這代開始,高通的alu在各種跑分中,利用率貌似能低到88%)

從另一種角度看,也可能是5納米的頻率/功耗曲線拐點太靠前了。

我現在就比較關心一件事兒,就是麒麟9000的低頻性能怎麼樣?是不是也像臺積電16nm節點時的FFC工藝一樣?在高頻時雖然表現不佳,但是頻率一旦降下來,功耗表現就會變得不錯?

比如簡單的算了一下,把這個GPU頻率限制到大概500兆赫茲的時候,曼哈頓3.1性能應該還在102幀左右,此時的功耗不應該高過5瓦。這個性能就超過865了,而且能效比近似。

當然這只是推測而已,我還沒有頻率功耗曲線。

或者說把麒麟9000的GPU性能降低到和驍龍865的a650平齊的情況下,功耗會不會有相當的優勢?

那麼也可以做個實驗,把蘋果a14的GPU也限定到曼哈頓3.1 90fps成績時,功耗會不會有驚喜?

待續


推薦閱讀:
相關文章