针对我自己感兴趣的部分更新下麒麟985的一些成绩。感谢qq811416com即wp7吧专用 帮忙到实体店做的测试。

麒麟985的cpu版本和820一样为打磨到最新的r0v4版A76。1*[email protected]+3*[email protected]+4*A55

麒麟985的cache规格和k820,也就是855一样,sL3不如980的4M砍到对半,对IPC必然有所有影响。单大核pL2 512KB,三中核砍半256KB。

我也顺便把麒麟掌握奇怪的gb4刷分后990/820/985的geekbench4成绩都修正了下(毕竟内存测试是个任人打扮的小姑娘)

麒麟985大核gb4实际应该是3150分左右,性能略逊980大核,也比较符合gb5(虽然gb5个别其他晶元成绩也很吊诡就是了)

麒麟985大核specint2006的成绩为24.71,相较于下图中的其他SoC的成绩可以看到,IPC非常吻合麒麟820,同时性能落后麒麟980的大核。但是通过drhystone和spec功率的初测(条件未统一后续更新),相比980有明显的进步,也就是说在移动端极为看重且需要的CPU能效上,有非常不错的表现

实现方式效率和anandtech不同,不要跨服打怪

根据bugreport可以看到,麒麟985的gpu规格为G77mc8@804MHz,频率和麒麟820上的g57mc6@804MHz一样

这点通过烤gpu的alu做madd也可以看出来,已知mali最新valhall架构的g77不再以执行引擎ee而是两个cluster,共32alu

32*8*2*0.804=411.7gflops,玛丽在这个软体中的效率一般在95—97%左右波动,所以804MHz的频率吻合bugreport里的标注。

反复测试过,成绩稳定,功率在3.43-3.45w波动

麒麟985的在性能模式下gfxbench的曼哈顿3.1离屏成绩为55fps,功率为3.43w左右横向对比中端SoC的GPU成绩,会发现结果看著尚可的亚子:

根据gfxbench低水平测试中的ipc看,alu、纹理单元都正常,曲面细分相比之下低得异常但这个表现对g77mc8这个规格而言可以说是翻车了。不仅相比天玑1000l规格略低的g77mc7@695MHz表现让人失望,相比同样规格近似的天玑1000的G77mc9@836MHz同样相去甚远。和自家麒麟820的g57mc6@804MHz而言,频率相同但进步可怜,G77的ipc甚至还不如自家的G57。

要知道g77 trym和g57 natt除了扩展规模下的命名不同,架构可是一致的。

我接受过专业的训练,除非实在忍不住

究其原因,其一各家对公版ip的驾驭能力确实不尽相同,各家拿到的ip版本新旧也不一定一样,比如980初期首发的a76/g76的表现都有所落后,而联发科对arm ip的驾驭能力似乎颇为有、东西。

其二,可能就是麒麟820/985平台对内存支持上的问题了。

关於单通道双通道内存的事(都以32位宽而言的),其实看非常不靠谱的geekbench4内存测试可以看出来:带宽成绩10-12一般是单通道1866,12-14一般是单通道2133,20+就是双通道2133,25+就是lpddr5了。

现在看来麒麟985/820平台仅仅支持到现在市场上的中端及以下的2*16bit 2133MHz lpddr4x

这点与竞品之后会上的天玑800系列相同(所以下面提到的相关掣肘竞品也可能出现),不如天玑1000系列以及上代旗舰等中高端普遍支持4*16bit 2133MHz lpddr4x,而高通三星旗舰平台现已经支持到lpddr5。

高通做gpu报告的ppt

内存及带宽在spec,gpu的基准测试,游戏以及系统性能等有一定影响。gfxbench这种纯gpu测试对带宽压力较大

麒麟980跑gfxbench曼哈顿3.1离屏的内存带宽需求

ds-5测出来l2的数据乘16就是最终带宽需求,单位为位元组/s。比如上图里面就是读6GB/s,写3GB/s,且运行同时对性能成绩有影响,所以980的g76mp10实际峰值性能下带宽需求会更大。越新的架构可能会减少带宽需求,到越大的规格,越高的性能,需求越大,而单通道lpddr4x@2133MHz的理论带宽宽是32÷8×2133×2约16-17GB,实际跑下来12+,无疑会更易接近瓶颈

这里其实已经可以从基准测试里看到,麒麟985理论上相比980性能伯仲,但整体能效更好,只是配套内存等略差,但实际呢?

这里其实有另一个和麒麟985同台的竞争对手,天玑1000L(关于天玑1000l的实际表现作为reno3/小米10/mate30pro 5g/iPhone 11机主测了谈了很多次了,根本没云评测传的翻车啥的,有趣的是这种盼望所有竞品翻车的都是同一群人)

4*[email protected],g77mc7@695MHz,4*16bit lpddr4x@2133MHz,天玑系列虽然还没大量出货,但mt6885的规格还是非常华丽的,基准测试成绩也极其优异,和麒麟985一样,精准卡到麒麟980的性能区间,spec/gfxbench等能效可谓是对中端及过气旗舰的虐杀,包括新出的麒麟985/820。gpu甚至在低性能同水平下,能效非常接近高通855的adreno640了(在曼哈顿3.1离屏51fps左右,855为2.55w,天玑1000l为2.7w)但峰值略逊,而麒麟985的gpu虽性能一致,能效尚不如天玑1000l。

理论联系实际,搭载天玑1000l的reno3也有优异的游戏表现。

而我曾经全程录视频对比测试过高通855和麒麟980…甚至是两台麒麟980,mate20pro和p30pro

关注几个单机大型手游

比如其中光明山脉最高设置项测试,依旧和之前测mate20pro和p30pro时候一样的流程和画质设置(我这里一直测的2k的渲染解析度,有的评测是跑1080p,注意区分一下),这个被燕十三拉出来吹高通820的游戏并没有什么地位被优化,发扬光大之前在845平台上也专门分析对比过,对cpu有不小的压力的同时,非常极其吃gpu。

reno3是16.5fps,整机4.4w,空载0.9w左右;相较麒麟980机型是16fps,整机5w,空载0.7w左右,能效表现还是很大优势,非常符合基准测试里性能接近,但能效领先的结果。

同时跟小白评测他们测试的几款中端的结果也可以对比一下,他们没有做功率测试并且只测了5分钟,但成绩比较吻合:

天玑1000l是16fps;麒麟820是13.9fps;高通765g是13fps;

这里也可以看到,高通765g和麒麟820并没有拉开足够的差距,要知道k820的cpu相比765g是有明显的优势的——这里的帧数结果更多的还是比较符合gpu基准测试里的性能差距,也变相佐证了图一中对此游戏的分析。

reno3 15分钟大型游戏的核心温度

而针对天玑1000l平台本身,我个人觉得这个成绩性能指标其实还没到顶,在每项游戏测试的统计结果里,都可以看到cpu温度到46℃左右后,系统就开始对性能输出做限制了——这是个什么概念呢?oppo自家865平台上限在60-70℃,游戏手机放得更高,连一向比较萎的华为,我们常说的为了续航发热调度挺萎的华为EMUI,对995平台也设置cpu保持55-60℃以下。

限制核心温度除了性能受到压制同时也让温度降了下来,比如在小白评测里765g/820吃鸡都是59fps,reno3是58.8fps,但温度确实还是更低:

而我自己测的是压力更大的雨林地图,之前同样条件录视频测过mate30pro 5g和小米10?:

865空载0.9w,整机3.4w;995空载0.5w,整机3.2w;这次试了reno3,空载0.9w,整机3.6w。功率能效表现应该说相当不错了,就是帧数虽然平均也有59fps,稳定性相比前两者肯定还是差点。

「ColorOS对天玑调度有问题」我觉得有部分原因在对于核心温度限制过严,这就类似当初联想z5pro上首发的855平台,晶元本身并没有放开跑,全靠本身的性能能效死撑——但即使这样的情况下,reno3的游戏测试也比980平台优秀,跟855打得有来有回,甚至在方舟生存进化,暗影之枪传奇上表现的更优秀。

我相信华为的软体实力,麒麟985肯定比mt6885平台能得到更多的支持,这两者本身就在同性能区间,最后以此为天花板,实际性能表现应该差得不多。

(更新:现根据数码先生等对nova7的游戏实测来看表现一般,方舟26fps,吃鸡57fps等结果接近天玑1000l但略不如)

如果需要无脑的对比结论总结的话(非常不支持要课代表啊要总结的行为,应该自己取抓关心的信息多方面来看)

麒麟985:

相比980性能伯仲,但能效更加优秀,实际性能输出更好。

相比855的cpu能效更好,gpu略差;

相比天玑1000l性能几乎没差,但ap能效低点,平台支持更高;

相比天玑800及800plus emmmmm plus版的cpu性能大概能比比…其余就对比k820去吧

而相比865…emmmm就像天玑800对比k985,同样没得比。

985对我本来的预期而言来说没啥翻车的(gpu确实不尽如人意),只是刀法极其精准,毕竟通道数目直接钉死了定位,其跟990的差距远大于跟820的差距——所以「820非常接近990」啥的就歇歇。

而某自己爆错料还等著道歉的威震天想来真是惹人发笑,毕竟预期被透支了是还不回来的。

况且说实话,现阶段麒麟820/985并没有在同价位有什么出彩表现,要么做等等党,要么…2149的nova6它不香吗?

当下华为系产品里我愿意称之为最强!


请不要仅因为名字就把麒麟985简单理解成麒麟980的5G版,两者的设计定位有本质不同。

麒麟985基于台积电7nm工艺制造,推测与麒麟820/810一致,都是N7,这点倒是和麒麟980一样。

它的CPU部分由1个A76大核(2.58Ghz)+3个A76中核(2.4Ghz)+4个A55小核(1.84Ghz)构成,咋一看似乎A76大核与A76中核的频率相差不多,其实中核的二级缓存容量(256KB)只有大核(512KB)的一半。这种中核二级缓存容量减半策略,倒是与高通的骁龙855/865一致,而麒麟980/990的中核二级缓存容量则与大核是一样的(均为512KB)。

不仅如此,麒麟985的共享三级缓存容量只有2MB,也只有麒麟980(4MB)的一半。请注意,尽管麒麟985的大核只有1个,频率比麒麟980的2个大核(2.6Ghz)还略低20Mhz,缓存容量也缩减了,但它的3个中核频率比麒麟980的2个中核(1.92Ghz)可高了480Mhz,规格上算是各有所长。目前的测试显示,麒麟985的CPU成绩与麒麟980近似,优势并不明显。

GPU部分则是Mali G77 MP8,频率大致在800Mhz。G77微架构与麒麟980的G76相比,单位密度性能 和 能效 都提升明显(ARM称幅度均超过30%以上),因此麒麟985只用了8核G77,就能赶超麒麟980的10核G76。

遗憾的是,荣耀30基本版上的这颗麒麟985内存(RAM)位宽只有32bit(2*16bit),只有麒麟980(64bit,4*16bit)的一半!而移动SOC中的GPU又是共享内存当显存用,因此麒麟985的显存位宽等于只有麒麟980的一半。结果,虽然麒麟985的GPU更强,但受显存位宽小的拖累,测试成绩有的比麒麟980强一些,但有的又差不多。

麒麟985集成5G基带,这部分与麒麟820一样,都是直接来自于麒麟990 5G版。

它的ISP和NPU也都来自于麒麟990 5G版。其中ISP升级到ISP 5.0,处理能力和能效都比麒麟980有明显提高,还支持BM3D图像降噪,有助于提高拍照画质。

而它的双核NPU因为采用自研「达芬奇」架构,AI算力直接比麒麟980的双核NPU(架构来自 寒武纪 授权)提高了近三倍。

值得一提的是,麒麟985不仅综合性能超过麒麟980,能耗表现更是优秀很多,它的 能效 相当不错(尤其是实测证明GPU确实提升了超过30%) 。这对手机而言很有意义,不仅减少了耗电,还因为发热少具备更稳定持续的高性能输出。

很多人不了解,麒麟985(也包括麒麟820)的A76核心 子版本 已历经几次更新到了V4版,与麒麟980采用的早期V1版相比,明显改善了能耗比,可不要只看表面都叫A76,工艺似乎也没变,就认为完全一样。

不难发现,目前看来麒麟985的整体设计与前一段时间发布的麒麟820很接近,只是规格明显提升。客观来说,麒麟985其实和麒麟820一样,设计规格还属于中档范畴,最明显例证就是32bit的内存位宽,并没有采用麒麟980/990这些高档定位的64bit内存位宽,显然是为了缩减内存控制器以降低制造成本。

尽管设计定位其实更低,在获得全方位架构技术更新后,就如同它的型号名称「985」所示,其综合表现仍稳稳超过麒麟980,正好切入麒麟820和麒麟990 5G版之间,进一步细分了麒麟的5G产品线。

麒麟985从传言开始,有的人不相信它的存在,其中一个原因就是它与麒麟990 5G版相比,似乎规格性能差异不够大。其实这忽视了麒麟990 5G版是去年9月份发布的,它的生命周期已进入下半程,再过几个月其旗舰地位就会被麒麟1020代替。如果你拿麒麟985和麒麟1020相比,它们之间的性能差距显然足够大,才是真正长时间搭档的上下级。

实际上在目睹麒麟985紧跟麒麟820发布,两者设计特点相似,还都有明显考虑成本的痕迹,我甚至产生了如下想法:

麒麟820设计之初是在5G时代用来替代麒麟710的,本来它会被命名为麒麟720。

麒麟985才是海思原本规划的麒麟820,用来替代麒麟810。

它们俩正好与预计八九月份问世,用于替代麒麟990的麒麟1020搭档,低中高三个档次,要是按原本名称就是720/820/1020,一家人整整齐齐(我在去年相关文章回复中,就预测过麒麟x20家族这三位成员的名称)。

但去年麒麟810获得巨大成功后,华为发现高通的应对迟缓而又软弱,明知骁龙730G被麒麟810完全压制,半年后更替的骁龙765G都算不上反超。这说明高通完全没有料到华为在中档产品上会如此大方,而每款SOC从规划到上市周期很长,高通在完全没有预案的前提下,下半年上市的提频版骁龙765G+也没多少杀伤力。

另一方面,非高端市场对4G SOC的需求仍很强烈,高通忙著推出骁龙720G以及其它更低档的产品,这同样意味著华为的麒麟810和麒麟710还有很长的生命期,完全没必要很快淡出。

有了这些前提,如果华为把原本的麒麟720/820更名为麒麟820/985提档上市,其性能水平不仅不会引发用户的反感,甚至可能获得掌声,同时也给麒麟810/710留下了充裕的继续存活空间。这还意味著,采用麒麟820/985的产品后期价格下调余地不小。

近期我们都看到了,华为和荣耀品牌除了高调推出麒麟985/820的5G新品,也仍在发布基于麒麟810/710A的新4G手机和平板,这似乎都在为我提供佐证。

最终,如果很长一段时间都没等到麒麟720发布,那这个猜想估计就要成真了。


我来科普一下, 华为库存看来真的很大,麒麟985就是麒麟980和巴龙5000焊在一起。 那天晚上我看见了,赵明把著门,看的很严,余承东拿著焊枪疯狂焊接,速度很快,就像一道光,可能是赶产量,如果你们谁能联系到他,就告诉他,我拍了照片,让他明天晚上松山湖找我,我在湖底等他。


麒麟985发布了。总体来说,我认为这款SoC总体来说是一款非常接地气的晶元——并不标榜黑科技,而是在考虑成本的前提下把新的技术尽早带给消费者。同时,它可能反映了一个明确的风向标,即在5G和AI这两个下一代智能手机的主打领域中,未来几年内将会出现指标大跃进,即每年都有很大的性能提升,而华为海思则凭借其多年积累,将成为这两个关键指标的领跑者。

接下来具体说说5G和AI这两个关键指标上麒麟985的表现。

在5G方面,官方的说法是「麒麟985同样采用台积电7nm工艺制造,单晶元整合5G基带方案而无需外挂,统一支持2G/3G/4G/5G网路制式、NSA/SA 5G双模,理论最高下行速率1277Mbps、上行速率173Mbps,相比于骁龙865+骁龙X55的组合分别快了大约40%、75%。」这里最重要的特点是相比高通方案需要外挂X55 5G Modem的方案,麒麟985使用了集成度更高的方案。当然,集成度高也并非没有代价。按照目前的资料,麒麟985中的5G并不支持毫米波频段,因此在峰值速度上相比高通X55还是会打一些折扣(Snapdragon X55使用毫米波频段的理论峰值是下行7500Mbps,上行3000Mbps,官宣中的比较应当是和X55仅使用sub-6GHz频段的比较)。事实上,目前5G建设仍然处于早期,毫米波频段的普及恐怕还尚待时日,比起高通那偏向技术理想主义,为了体现技术实力追求峰值速率而支持毫米波频段的高成本做法,麒麟985追求高集成度,争取降低成本让更多人能先体验5G的做法事实上更接地气。

5G方面,官宣的另两个特点分别是「针对高速场景做优化」和「低功耗」。这两者背后主要现实的是工程实力,例如高速场景优化主要是考虑多普勒效应,需要对射频和无线模块的演算法做大量优化,而低功耗的优化也是靠架构和电路方面一点一滴堆出来的。当然并不是说这两个优化就没意义——相比起基站还没到位的毫米波,高速场景(例如乘坐高铁)和低功耗看上去对于消费者来说甚至更实用一些。

在人工智慧方面,麒麟985整合了双核达芬奇NPU。其具体效果我们不妨看看AI benchmark的跑分。

我们可以看到,麒麟985的总体分数AI-Score处于领先的位置,仅次于其旗舰级SoC 麒麟990和联发科的Dimensity 1000。然而,如果我们再仔细看一下各项评分,我们还能看到更多门道。联发科的Dimensity 1000的综合分数高,主要是由于其CPU系列的分数和FP32(GPU)分数较高。在FP16分数(主要体现AI加速器IP的算力)上,麒麟系列是显著领先的,而985的性能更是比起上一代980翻了三倍,而这也体现了达芬奇系列NPU的实力。在未来,我们预期绝大部分人工智慧相关的应用会运行在AI加速器IP上,因此我们认为实际上麒麟系列是AI性能的领跑者。然而,具体到用户体验方面,其中有一个可能的问题就是兼容性和编译器的问题,因为如果编译器和底层lib的兼容性不够的话,许多AI应用就不得不跑在CPU上,而这也会使实际用户体验大打折扣。所以,AI的性能不能只看硬体测试结果,还要看(底层)软体生态。希望华为在这方面能更进一步努力。


就资料来看,麒麟985应该算980的硬体优化平衡和无线演算法上的升级。既然题目是这么问的,那么可以分硬体和软体来分别描述。

和980的硬体对比:

从主频和核心架构上,985显著提升了2个A76中核的工作频率(1.92GHz→2.4GHz),略微降低了一个大核的工作频率(2.60GHz→2.58GHz)。因此可以认为它在参数上要强于980。当然,好处是如果SoC电源管理和计算分配合适的话,大核数目提升可能会导致中等计算这类日常应用的平均体验提升,峰值计算性能可能略有下降。

  • GPU从Mali-G76MP10 变成 Mali-G77MP8,架构升级+GPU核心数目降低,这种平衡很可能会让985和980GPU性能相近
  • NPU从寒武纪的授权双核换成自家的达芬奇双核,鉴于AI晶元今年的快速发展,所以AI计算能力会有显著提升,相关参数其它答案里有提到。AI benchmark的评分大概是从18670(980)→50926(985)

所以,硬体基本是跟随历史潮流的优化平衡。

软体:

我没看发布会,各位其它答主提到「高铁场景」演算法优化,那显然华为是觉得这个场景可以拿出来说说最近终端方面通信的技术进步,因此我们可以猜猜华为做了什么。

在4G里无线通信领域高铁场景的信号处理演算法难点[1]主要有三个:

  • 1)车体穿透损耗和信号入射问题
  • 2)频繁的小区切换和重选
  • 3)高速移动带来的多普勒效应会导致信道快变

在5G系统里,考虑到空域自由度的探索和波束概念的广泛插入,还应该加上一个4)在高速场景下的波束对齐和波束管理问题。

其中问题1终端几乎束手无策,需要运营商和高铁制造商通过更换车厢材料和基站位置来解决。问题2同样,需要基站考虑更好的小区切换和接入调度,比如设计更加简化信令交互流程,终端能解决一部分问题,比如因为小区切换是周期性的,可以预测小区切换即将到来,提前搜索新信号。但终归性能会比较有限。

3有可能通过终端信号处理演算法缓解,这也是最有可能的985 SoC的演算法改进。这基本是古老的研究方向,快变/双选信道下信道估计和反馈的延伸。怎么做的。。演算法很多,反正看措辞看不明白。

4是主要靠接收波束赋形和发射波束预测,对齐来避免可能的扫描损耗和波束不匹配,高铁是个很典型的高动态,2D移动场景,接收波束赋方向是可以预测的。至于怎么做?可能是扩展卡尔曼滤波?(近两年有几篇高铁波束赋形这方面的论文)

(以上纯瞎猜,我随便写的别当真)。

参考

  1. ^很久以前自己的答案: https://www.zhihu.com/question/299161601/answer/514705568


推荐阅读:
相关文章