各位知友,大家好

今天下午,我们在北京组织了媒体沟通会,第一次有机会和媒体、花粉朋友们深入交流荣耀9X和麒麟810处理器。毫不夸张的说,麒麟810是一款名副其实的旗舰级晶元,采用目前最顶级7nm工艺、Cortex-A76架构,实现旗舰性能。自研达芬奇架构NPU,AI Benchmark跑分,超过32000分,全球第一高分。具备810晶元的9X也将全面达到甚至超越旗舰手机的水准。

「芯优一级压死人」,领先7nm工艺。

摄影圈有句话,叫「底大一级压死人」,我觉得有句话同样适用于晶元领域,那就是「芯优一级压死人」。

目前来说,7nm是业界最先进半导体制程技术。先进位程技术能带来更高的晶体管密度,更快的速度,更强的性能,更低的漏电,以及更高的能效比。2018年,海思

率先发布业界首款7nm工艺制程晶元—麒麟980。同样的,这一次,我们也迅速把7nm工艺落到了麒麟810晶元上。我们即将上市的9X搭载的就是7nm的麒麟810。

目前采用7nm工艺的处理器有四款,分别是麒麟980、骁龙855、A12,剩下一款就是麒麟810了。麒麟810的背后,是36个月+的研究与开发,1000+半导体设计与工艺专家,5000+工程验证开发板的投入。我们早在2015年就启动相关研究,一次投片+测试就是2000万美金,一颗晶元从研究在量产的研发成本就高达数亿美金。这些重型投入才让810晶元用上7nm工艺。

甚至也可以说,在未来较长的一段时间内,最先进的工艺制程就是7nm!

旗舰级定制A76大核,硬核性能

先看手机的发动机——CPU。麒麟810采用当前最强的大核A76进行定制,至少量产的A77还未看到。再展开来看八核CPU,2颗最高频率2.27GHz的基于Cortex-A76定制的高性能大核,以及6颗最高1.88GHz的Cortex-A55的高能效小核。一顿魔改带来极致性能,相比于上一代8X,单核能力提升75%,多核能力提升40%。对比友商最新晶元,810在性能和能效上都有明显优势。

如上图,针对移动体验场景,创新的2+6大小核搭配根据不同应用进行灵活CPU资源调配,保障全程高性能的同时做到了良好的功耗表现。比如听音乐的时候,开一个小核就够了;玩重载游戏时,4个小核+2个大核。

定制GPU核心,AI智能调度

麒麟810的GPU部分为Mali-G52核心,并且我们做了深度定制六核心,通过GFXBench测试,在1080P曼哈顿离屏、GPU能效0.8W两项中都大幅度超越上一代。

支持麒麟Gaming+技术,包括系统级的AI调频调度、GPU底层驱动升级及GPU负载优化、HD游戏特效优化。减少重复指令及GPU负载,并加快CPU、GPU和内存之间的数据传输速度。达成提升游戏画质、清晰度、明暗对比度的目的,带给游戏玩家更畅快的游戏体验。

在晶元运作的最底层,采用了AI调频调度技术,通过AI演算法和机器学习,精准预测系统每一帧的负载,准确性比传统技术提升30%以上。具体操作则是,实时学习帧率、流畅度、和触屏输入变化,动态感知游戏性能瓶颈,对CPU、GPU、DDR进项系统级融合调频调度,使游戏能够稳定保持在高帧率。

如上图,主要两个方面的改进。第一个是,AI负载预测精准,系统给下一帧分配足够频率和核数,确保系统流畅。而传统负载预测则会分配算力不足导致卡顿。第二个看后面这个节点,AI负载预测下一帧需要算力较少,故分配了更低的频率和更少的核数,可减少能量损耗,助力手机长续航。

GPU Turbo 3.0 游戏体验新突破

荣耀祖传GPU Turbo这次升级到3.0,通过图形加速带来更低的功耗和更快的毫秒级触控响应。同时,我们支持的游戏数量进一步提升到70+款。

从魔改的旗舰级A76大核CPU,到定制的MaliG52六核GPU,再到麒麟Gaming+及系统级AI调频调度。同时,再辅以7nm最新制程工艺,还有Gamebench游戏联调。我们几乎给9X配置了市面上最高的规格。这一切都只为在游戏体验上,有一个无法低调的突破。

自研达芬奇架构NPU,跑分全球第一

在冯·诺伊曼体系结构中,通用计算机的计算部分都交由CPU(Central Processing Unit,缩写:CPU)来完成。随著乔布斯和比尔盖茨普及了图形化界面,人们发现用通用的中央处理器(CPU)难以处理复杂图像渲染计算。于是乎GPU(Graphics Processing Unit,缩写:GPU)诞生了。GPU是专为执行复杂的数学和几何计算而设计的,这些计算是图形渲染所必需的。

到了移动互联网时代,伴随人脸识别、拍照特效等的普及,各类AI演算法愈发常用。人工神经网路的处理速度成为了瓶颈。一个高效的神经网路引擎迫在眉睫。因此,我们在2017年就率先推出了NPU(Neural-network Process Unit,缩写:NPU),在照片、游戏、AR等方面,为用户带来更流畅的体验。现在我们在手机端又进行了升级——推出华为自研的达芬奇架构NPU。

达芬奇架构是全新的自研AI计算架构,针对AI计算特点进行设计。不同于二维运算模式,达芬奇架构以高性能的3DCube计算引擎为基础,针对矩阵运算进行加速,大幅提高单位功耗下的AI算力,充分激发端侧AI的运算潜能。神经网路运算数据为3D格式,需要处理单元的创新,NPU在处理AI任务时,性能和能效远高于CPU和GPU。

根据苏黎世联邦理工学院(ETH)发布的AI Benchmark跑分,超过32000分,全球第一高分。

接下来,我看看最常见数据格式在常用模型下的表现。

1)在FP16数据格式下,相比于骁龙855,麒麟810在VGG、Resnet34等多个演算法模型中,有较高的性能和能效优势。

2)低比特量化是当下人工智慧研究的重点之一,如何在低比特量化的同时,最大化保留计算精度,是各晶元厂商重点投入解决的问题之一。在INT8数据格式下,对比855,麒麟810精度保留更好,例如右边的图,在超分原图的时候,855在鸟的脖子处有大量的计算精度丢失进而导致斑点。而麒麟810则更好的保留了精度。

再回到这个超分性能对比,在保证超分效果的同时,麒麟810耗时1.7s,Q855在同一张图上耗费了2.4s。

知友们应该都没见过麒麟810的真容,晒两张图给大家展示下,旗舰晶元麒麟810本体的真容。旗舰级的晶元用在旗舰配置的手机上,荣耀9X真旗舰手机。

7月23号,注定无法低调的9X在西安与大家见面。更多关于荣耀9X的信息,敬请大家期待西安发布会。

推荐阅读:

相关文章