2020 年 10 月 22 日,华为发布麒麟 9000 晶元,采用 5nm 制程,具有 153 亿个晶体管,拥有 8 核 CPU(1 个 A77 核心 3.13 GHz,3 个 A77 核心 2.54 GHz,4 个 A55 核心 2.05 GHz),24 核 Mali-G78 GPU,2 大核 + 1 小核 NPU,内置巴龙 5000 基带,ISP 6.0 支持 LPDDR4X/5 存储,如何评价这颗全新晶元?


目前的功耗测试的相关我放在的末尾。

今晚上一共发布了3款处理器:麒麟9000、麒麟9000E、麒麟990E。

先说最次的麒麟990E:麒麟990 5G的GPU减配版。

这款处理器和麒麟990 5G唯一的区别是:16核G76 GPU缩减为14核G76 GPU。其他完全一样。

关于这款晶元来说,没啥太多好说的。麒麟990 5G上市一年,具体什么表现大家都是很了解的了。

有一种说法是目前晶元稀缺,用一片少一片,因此这种体质相对较差的,就屏蔽部分核心拿出来用,以前的话是直接处理掉的。

特殊时期,理解一下。

目前用在这货上,这个看京东详情页除了处理器其他描述和Mate30Pro完全一样(包括拍照、充电等等),有说法是去A化后的产物。总之看价格吧。

华为 HUAWEI Mate 30E Pro 5G麒麟990E SoC晶元 双4000京东¥ 9999.00去购买?

然后说说麒麟9000和麒麟9000E

麒麟9000E是麒麟9000的略微降配版,应该也是屏蔽核心的做法,NPU从2大核1小核缩减为1大核1小核,GPU缩减2个核心。

麒麟9000E用在Mate40标准版上,目前还不支持预订。

而麒麟9000,可以说是目前为止,取代骁龙865暂时登顶安卓处理器排行榜,目前为榜首。

目前用在这三个上面:Mate40Pro、Mate40Pro+、Mate40保时捷设计。

华为 HUAWEI Mate 40 Pro麒麟9000 SoC晶元 超感知徕卡京东¥ 9999.00去购买?

华为 HUAWEI Mate 40 Pro+麒麟9000 SoC晶元 超感知徕京东¥ 9999.00去购买?

华为 HUAWEI Mate 40 RS 保时捷设计麒麟9000晶元 超感京东¥ 99999.00去购买?

一、CPU部分

架构:

整体的配置和骁龙865类似,而大中小核(相对865)都有一定程度的提频,配合5nm制程带来的性能提升,最终做到性能比865Plus强10%,能效高25%。

很可惜的是由于制裁原因,麒麟9000没法用上最新的X1/A78架构,不过高频A77配合5nm,也不错了。

二、GPU:此次最大升级点

架构:Mali G78 MP24 759Mhz

据传:默认模式为500Mhz

这次华为史无前例的将GPU规格堆满(G78最高可以支持到堆24个核),而超大规模的GPU带来的就是性能和能效的巨大提升。

官方宣称能效比骁龙865+强50%,性能跑分(GFXbench 5.0 1440P 阿兹特克 Vulkan high tier offscreen)高52%,是非常大的领先了。

如果参考3DMark新出的Wild Life跑分的话,麒麟9000跑出了5000分的高分,相比3800左右的骁龙865有明显优势,基本持平超频到915Mhz的骁龙865(代价是发热严重超出手机承受能力)

总之,这次麒麟9000的GPU可以说是最大的亮点了。

左:P40Pro(K995) 右:M40P(K9000)
骁龙865@587Mhz(默认最高频率)跑分
骁龙865@915Mhz(超频)跑分

而目前找得到的GFXbench 离屏成绩

  • 在默认模式下,也许是为了控制发热和续航,麒麟9000的性能控制在略超骁龙865+的水平
  • 在性能模式下,麒麟9000的性能持平/略超骁龙865超频至875Mhz。
  • 麒麟9000相比麒麟990提升巨大,曼哈顿3.1离屏帧数提升有50%之多。

三、其他

基带部分,此次凭借5nm成功将巴龙5000集成到处理器内部,不出意外的话麒麟9000也支持毫米波了。

全新升级的NPU、ISP等。支持LPDDR5。这些就不再赘述了。


关于目前的烤鸡测试

1、玛丽烤madd vec4 fp32效率在95%上下。而之前有个10W功耗的算下来是94%的效率,算力符合。

2、烤鸡测试的这个功率,这只是alu功率,只是做基本×+运算的功率,跟图形功率没有特定联系(gpu不只是alu)比如高通前几代拿这个测试功率都很高,烤鸡alu利用率有80+%,实际跑图形测试alu利用率只有60+%…,这就可以解释我之前说的:我那855跑曼哈顿3.1功率5W不到,而烤鸡远不止5W。而麒麟这边也是一样,烤鸡10W,跑GFXbench以及实际游戏的时候肯定是没有这么高了

3、那个据传是更新系统之后跑的烤机图,峰值功耗9W,逐渐降低到5.6W。

之前不是传闻性能模式是759Mhz吗,根据理论计算759mhz*24核*每核32alu*2=1165.824gflops

图里面显示峰值1055.1 GFLOPS,基本上相差不大(考虑到效率不是100%),所以有可能并没有降低最高频率而是烤久了温控降频

关于这方面我也是一知半解。持续学习中。


更新下:麒麟新一代5G晶元是我最关心的点。

1. 为什么要有两个版本:9000和9000E ?

看发布会PPT,9000E比9000少了2个GPU核心,但仍然有夸张的22个,NPU核心也少了一个。这样的话,虽然配置略有差别,但定位、性能其实都拉不开。这与麒麟990 5G和麒麟985之间的巨大差距是完全不同的。

为什么要出2个接近的核心?

有可能是因为5nm良率问题(TSMC 背锅),需要屏蔽坏核心。还有可能是制裁令下,华为为了多拿到晶元存货,把一部分良率不足的die也挑了出来(只是猜测),做成了麒麟9000E。不过按照微弱的区别,麒麟9000E的性能完全不需要担心。

另外,从麒麟9000的153亿晶体管来看,还是大面积die,不知道成本怎么样(看最终国行定价),5nm晶元12英寸一片已经涨到17000多美元了,对比7nm只有9000多美元。

2. 9000E的工艺是什么?

已经确认是TSMC N5,Mate 40采用。后续荣耀的机型,平板等等可能也会采用这一款Soc,取决于有多少存量。

3. 麒麟9000系列产量如何?

最关心的产量问题没透漏,可能确实不乐观吧。

最后,《dream it possible》,致敬!


亮点不说了,这晶元发布得很让人心疼。

为什么会发布三个档次的晶元?

因为往后就没麒麟晶元用了,目测华为和荣耀之后发布的中高端系列手机,都得靠这三款晶元撑著,起码华为是这样在准备最坏的情况的。所以990e大概率很快就会下放给荣耀和华为Nova等系列,可能会接替8系列晶元的生态位,承担麒麟830的角色。

为什么9000的GPU要把料堆到极致?

哪怕这可能会让发热问题没那么好处理,不够均衡,还不是为了在之前台积电还能供货的时候赶出来能赶的最强晶元,来维持明年的旗舰机在处理器上依旧能打。

但凡对晶元和手机有一些了解的,都能从这场发布会的细节中看出来「艰难」两个字。

如果华为是正常的状况,其实我会劝预算不太够不急著买手机的朋友做个等等党,因为这些晶元绝对会下放给之后的系列新品,990减配的990e其实也足够好足够用,只是没那么极致罢了。

可惜没有如果,所以我想说,大家想买华为的还是赶紧买吧,早买早享受,买一个少一个。即便是搭配990e的mate30E pro在目前和明年也依旧算得上高端机。

扯爱国有点没意思,但是对华为这个品牌有感情或者不想离开华为生态EMUI系统,有换机需求的朋友,真的支持一下华为吧。

帮华为一起,撑过日蚀的至暗时刻!

华为mate40 Pro 5G手机 素皮绿色 全网通 8G+256G(碎京东¥ 8199.00去购买?


长文预警,持续更新

一句话概括就是,目前安卓阵营顶级的性能,但由于调度不善导致的表现并不理想,不妨碍这是个底子很好的处理器,可以等一波完全体,后续华为可以通过OTA推送,限制一下麒麟9000的频率,将会获得非常不错的体验,大于等于骁龙865。但是不出意外,应该不会强过后续的骁龙875。

发布会当天正巧有事儿,我没有看,之后看了很多大佬的文章,我当时还是很沸腾的,其中最大的一点就是GPU的提升,相比于骁龙865提升52%,这在历史上是绝无仅有的,大多数时刻,华为的麒麟处理器,相对于头半年发布的高通骁龙处理器,尚且在GPU上往往存在弱势,而这次一反常态,如果达到其宣称的52%优势,那么我有理由认为,麒麟9000在GPU上肯定能超过骁龙875,而875相对于麒麟9000即便有著四个月的时间差,可能也只有在CPU表现上更好,所以两者我认为是可以互有胜负的。然而一天的时间不到反转太快,我既然当时没有选择出来写个什么东西,发表一下自己的看法,干脆就再等一等,看看还有没有后续的翻转。

今年的5nm处理器命运多舛,先是苹果a14挤牙膏,之后麒麟9000翻车,按道理来讲,这两家的晶元IC技术都是业内顶级的,不太容易同时翻车,其中最大的可能应该就是TSMC5纳米工艺的问题。我头半年就说过,这是一个能效和密度工艺,而不是高频工艺,高频率带来的高热密度是指数性的,对CPU的影响非常大。因此5nm就应该抛弃Finfet选择GAA,IC厂正确打开方式应该是大规模低频率。一个没有被深度打磨的节点,频率/功耗曲线是注定不好看的。intel在此处开心的拍起了肚皮,

由于我不是专业人士,但是评价一个菜好不好吃,不一定非得要成为一个厨子。我只给出几点猜想,但是确实没有能力去验证,希望大家批评和指正。

首先值得提出的一项是,即便麒麟9000确实存在功耗不好看,但这仍然是一款我心目中的好处理器,至少从规模上来看,华为是有诚意的,是想做出一款优秀的处理器的。而从实际表现来讲,麒麟9000仍然是目前安卓阵营最强的处理器,没错,我认为它比骁龙865系列要强一些。

首先是CPU部分,采用了与骁龙865同样架构的A77架构,在GB5.0跑分中,单核分数为1020,对比骁龙865,单核性能强9.7%。其中频率提高为10%,可以看出两者IPC基本一致,缓存结构上麒麟9000这边暂时未知,而骁龙865那边应该已经是「满血」A77了,如果不出意外,两者应该是同样的缓存结构。

麒麟9000的最高主频定的有点高了,A77和A76是同样的流水线结构,ARM官方对这两个架构的设计本身都是在3GHz以内的,而高通和海思甚至超越了ARM的「目标」,3.13GHz既不是A77的甜品,也不是5nm的甜品,不出意外地讲,这个频率之下,收益和付出明显是不成比例的,不仅是麒麟9000系列,甚至之前的骁龙865+,我也不是很满意,为了10%不到的性能而需要消耗额外20%的功耗,这无疑得不偿失,我认为目前所有的ARM移动处理器在内,最高频率都不应该高于3GHz,这个论断不是说基于某一个什么规则或者定理,而是经过大量处理器的实测经验推导。当然对于苹果的处理器另当别论,比如苹果a13明明可以在2GHz得到性能与功耗的双重胜利,偏偏要选择为了30%的性能而浪费了150%的功耗,难以理解。

重头戏在GPU上。

G78MC24是让我震惊的,希望之后的dieshot可以解析出麒麟9000的GPU部分,究竟有多大的面积。这个规格直接达到了g78的上限,在历史上同样是绝无仅有的。

回顾一下历史,华为海思k3v2采用了gc4000的GPU,暂且不表。

麒麟910 mali T450mp4(这一代的架构没有统一渲染管线,顶点和像素填充是分开的,代表机型mate2)

麒麟920 /925/928 mali T628mp4 (624)对比更早的exynos5420为mali T628mp6

麒麟930/935 mali T628mp4,没变

麒麟950/955 mali T880mp4,跳过mali7系,性能大幅提升,但是和同时期的安卓旗舰骁龙820比,差距还有很大。同期exynos8890为880mp12(自以为这一代非常可惜,如果GPU激进一点儿加到MP8,频率低点,那么950将有能力和骁龙820掰掰手腕,虽然即使这样,GPU的性能和能效仍然不及,但是CPU是明显有优势的,很可惜并没有,8890做了如上实验,880mp12,然而在性能和功耗方面,仍然双输adr530,可见adr5系时代,高通的GPU相当强势)

麒麟960 mali G71mp8,我认为麒麟9000最像这一款,在峰值性能上是明显超过半年前的高通旗舰,可惜功耗高了。同期exynos8895为G71mp20。

麒麟970 mali G72mp12,exynos9810是G72mp18

麒麟980 G76mp10

麒麟990 G76mp16

麒麟9000 G78 mp24

这里头除了麒麟970到麒麟980,MPcore数量减少了,其他都是增加的。但是G76对于G72的规模是翻倍的,也就是说G76mp10其实相当于G72mp20,所以还是增加的,

多核低频,谁不想啊。

G78mc24就是典型的多核,甚至已经多到了上限,但是频率却并不低。我猜这个GPU应该设置在500MHz以内,在这个频率之下性能不弱于骁龙865,且有能耗的优势,对于目前的麒麟9000来说,这个目标显然是够用的。因为目前所有的G77 G57架构,频率基本都在700MHz附近或以上。可以从天玑820,麒麟820,麒麟985,天玑1000推断一下,用曼哈顿3.1 说事。

天玑1000+ G77MC9 836MHz 81fps/5.4w

天玑820 G57MC5 900MHz 55fps/3.3w

麒麟820 G57MC6 804MHz 47fps/3.3w

天玑1000L G77MC7 695MHz 55fps/2.98w

麒麟985 G77MC8 804MHz 55fps/3.45w

??大家都是台积电N7,mtk的效率显著高于麒麟,按道理讲,这个规格下不至于内存带宽成为瓶颈,比较费解。

这里面要先确定一个共识,性能随规模正比例变化,功耗随规模正比例变化,而性能随频率按高次幂变化。

所以我觉得这逻辑是没有问题的,道理上讲G78MC24在804MHz时,功耗10瓦,性能应该在曼哈顿3.1 160fps左右。

而实际上麒麟9000的GPU性能没有达到这个数字,但是功耗达到了。这还是5纳米对比7纳米的情况下,换句话说,难道5纳米在同性能下比7纳米的功耗还要大?

而且是没有考虑g78,相对于g77区别。要知道g78相比于g77是有一定的能效优势的。

有一种可能是热密度导致的,但这也只会决定功耗,并不会影响性能,尤其是GPU这种并发度很高的硬体。(这么大规模下,alu利用率也能达到94%以上,作为对比,adreno640这代开始,高通的alu在各种跑分中,利用率貌似能低到88%)

从另一种角度看,也可能是5纳米的频率/功耗曲线拐点太靠前了。

我现在就比较关心一件事儿,就是麒麟9000的低频性能怎么样?是不是也像台积电16nm节点时的FFC工艺一样?在高频时虽然表现不佳,但是频率一旦降下来,功耗表现就会变得不错?

比如简单的算了一下,把这个GPU频率限制到大概500兆赫兹的时候,曼哈顿3.1性能应该还在102帧左右,此时的功耗不应该高过5瓦。这个性能就超过865了,而且能效比近似。

当然这只是推测而已,我还没有频率功耗曲线。

或者说把麒麟9000的GPU性能降低到和骁龙865的a650平齐的情况下,功耗会不会有相当的优势?

那么也可以做个实验,把苹果a14的GPU也限定到曼哈顿3.1 90fps成绩时,功耗会不会有惊喜?

待续


推荐阅读:
相关文章