游戏性能是比较复杂的,本身就相当于一个混合负载,不同引擎还有不同的特性。参考之前zen3 apu性能提升微弱,甚至L3速度修复后依旧微弱,这还得进行更详细的分析才行。


缓存性能下降的话,L1、L2的延迟增加是意料之中的(容量增大的后果,ICL可复现),L3的延迟增加的确比较奇怪,不知道是不是因为14nm的布线限制导致的。

理论上BIOS原因导致ring频率不稳定也是有可能的(RKL要求电压更高,和zen3类似也会对类似EDC的电流指标有更高要求),但延迟测试的负载不大啊,不该不稳定吧。而且功耗测试里也提到说能稳定4.6G?

如果说是微码导致L3延迟增加,我倒是比较怀疑。因为都出正式版了,bug应该修得差不多了,真要期待提升也是针对硬体设计存在的问题做更好的workaround吧。


spec测试编译器还是用的clang10+avx2(针对haswell),相比ICC可能发挥不了新架构最佳性能,但也算是为了横向对比做的妥协。换个角度,如果一个架构需要更多精力做专属优化才能获得好成绩,那也算不上什么优点。

spec成绩还是低于zen3,考虑到之前TGL-U的表现,倒也不是很意外。不过要注意的是spec总分是「几何平均值[1]」,所以不适合按照线性去算分差的,算相对百分比更合适。

比如看specint总分,zen3比RKL高0.7看著很吓人,但其实也就是高10%,所以这个成绩对频率还是比较敏感的(所以zen3相比zen2提升巨大,频率+缓存+IPC三管齐下)。如果是单核频率不够稳的话那结果很好解释,如果单核频率是稳定的话那的确不是很好看,只能说任重而道远。

具体看specint子项,zen3相对RKL刷分的主要是520、548、557三项,每个都高了23%~25%。但参考这篇论文[2],其中520和557还是对缓存大小挺敏感的,大于14M的缓存依旧能比较明显地降低LLC miss。

PubMed Central Image Viewer.?

www.ncbi.nlm.nih.gov

L3大小,zen3有32M而RKL只有16M,而且后者还是包含式,实际利用率会更低些(论文研究的是SKL-X,用的非包含式L3)。可以等等看TGL-H的测试,TGL-H8核会有24M非包含式缓存,加上显著更高的L2,理论上这两项也会有更高的成绩。

505和541两项zen3也有10%左右的优势,参考这篇论文的话[3],这俩是branch miss最高的两项,同时541的L3 miss也最高,无脑猜测分支预测和缓存方面intel还是存在些许劣势。

而从历史角度上看,zen2/3依旧有著更多ALU埠(intel选择int/vec复用而把loadstore拆分得更细),更大的uopcache(而且限制似乎更少带宽也更高),更高带宽的L3。当然纸面数据不见得能反映实际性能,intel可能是综合了workload特性才做出这样的设计。不过如果workload本身有偏差的话,精明反而容易被精明误吧。


至于说功耗,14nm还能指望有什么好看的功耗吗?10nm都打不过对面的N7HD啊。不过拿avx512的功耗去比较还是不太合适,干更多的活耗更高的电,天经地义。只比较AVX功耗的话,感觉增加幅度也不算大(考虑新架构堆了规模)。

其实参考TGL-U的频率功耗,10sf的功耗也不好看,再加上密度上差于N7,我感觉intel陷入了无脑暴力追求性能的窘境,为了榨出最后一点性能,宁愿牺牲功耗和密度。CPU团队应该向GPU团队学习,gen12对比gen11密度增加性能增加功耗不变,这才是更理想的前进方向。

参考

  1. ^几何平均值 https://zh.wikipedia.org/wiki/%E5%87%A0%E4%BD%95%E5%B9%B3%E5%9D%87%E6%95%B0
  2. ^Memory hierarchy characterization of SPEC CPU2006 and SPEC CPU2017 on the Intel Xeon Skylake-SP https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6675054/
  3. ^A Workload Characterization of the SPEC CPU2017 Benchmark Suite https://uweb.engr.arizona.edu/~tosiron/papers/2018/SPEC2017_ISPASS18.pdf


现在说倒退言之过早

这是Anandtech的一份特殊评测,我不知道有多少人认真看完评测说明:

A站和Intel是签了NDA(Non-Disclosure Agreement,保密协议)的,而Intel的11代桌面(Rocket Lake, RKL)解禁时间是3月30日,理论上在这个日期之前,A站是不能公开任何Intel所提供且未公开的RKL信息的。

但这次的RKL,前几天德国的零售商Mindfactory不知出了什么问题,提前销售出去一批i7-11700K,据说大概有120颗,A站搞到了一颗。

有关这颗CPU的一切信息,因为并非Intel提供,不受NDA约束,所以A站可以提前做这么一期评测放出来。但里面还是有部分Intel提供的信息受NDA约束而不能公开的,例如很重要的一个信息:评测平台使用的主板及BIOS版本

CPU本身是零售渠道出来的正式版,B0步进,理论上不会有什么问题。但主板和BIOS就不好说了。本来在产品公开发售前向媒体提供评测产品,就是发售前的最后一个非公开测试环节。毕竟CPU、主板厂商都不可能用市面上所有的硬体、软体组合全部测试一遍,提前把产品给媒体评测也是扩大测试范围、增加测试用例的一种手段。如果在媒体评测中出现什么问题——包括性能达不到预期效果,在公开发售前还有解决和修正的机会,甚至不排除因为问题很严重又无法在发售前解决而推迟发售的可能。

就A站的这份评测数据, @JZWSVIC 根据CineBench R20的单线程成绩,怀疑最高睿频5.0 GHz的11700K测试时只是工作在4.7 GHz,我觉得很有道理。那么如果是主板的睿频机制有问题的话,Ringbus/LLC的频率是否工作在正常频率,也是要打个问号的。

有些朋友可能没有留意,Intel的CPU有一个Uncore频率(在某些主板BIOS中可能叫Ring频率)。顾名思义,UnCore就是CPU中除了CPU核心以外的部分(不含核显),就Intel的CPU来说,包括三级缓存(也叫末级缓存,Last Level Cache,LLC)、环形互联汇流排(Ringbus Interconnect)、内存控制器、PCIe控制器等模块。在Intel的桌面、笔记本CPU中,为了提供最高速的响应速度,UnCore部分的工作频率往往高达4 GHz以上,例如10代旗舰的10900K,Uncore频率最高是4.3 GHz。

这几代Intel的CPU,虽然因为工艺问题,一直使用14nm和老旧的Skylake架构,但Zen3上市之前一直是游戏表现最好的CPU,即便Zen3上市后,相当部分游戏中依然是Intel更强,三级缓存、核间互联、内存延迟性能是很重要的原因(也和Zen2/3使用独立IO Die,且Infinite Fabric汇流排频率只有2 GHz不到有关)。即便说RKL用14nm工艺来生产为10nm设计的核心架构,比10代的Skylake核心晶体管数量多了核心面积大了,需要更长的导线联通,只要Uncore部分频率没有大幅下降,不应该有这么大的性能倒退。

如果说一级缓存、二级缓存因为容量增加,延迟高了一个时钟周期算是正常的话,LLC容量没有增加反而延迟高7.5个周期,17%的性能下降;内存延迟高了34个时钟周期(内存还从DDR4 2933升级到DDR4 3200),13.7%的性能下降就很不正常了。LLC、内存延迟高了这么多,其它测试成绩,尤其是很看重内存延迟的游戏测试成绩不佳就是自然而然的事了。

除非有其它媒体公开一致的评测成绩,或者A站给出测试时的核心、Uncore频率曲线,否则我更倾向于这个成绩是A站测试平台的问题,而非RKL的正常表现。


Anandtech那个11700K应该用的不是最终版的BIOS,测试成绩应该会和正式版有些差异。

之前就说首发评测搞不好会翻车,这个比首发更早的测试翻车了就更正常了。RKL一直被说现在有些BIOS微码问题,看这个评测也好像内存性能有些问题。 ???

具体看这里:如何评价Intel i7 11700K?

就现在这个非正式版的表现,是在可预期结果内的~ Rocket Lake的Ringbus在现在微码上有问题,结果也对得上。

RKL的Ringbus物理上都变短了,这个成绩挺不符合预期的。等正式版,再来判断是硬体倒车了,还是现在优化问题。

当然,Rocket Lake可能到正式版的内存性能也得不到改善,这个倒车在Tiger Lake里有点苗头。Rocket Lake毕竟是真的换了内存控制器,那个Gear 1和Gear 2搞不好第一次弄就弄翻车。Tiger Lake和Rocket Lake的这块改进都在给Alder Lake铺路。

如果说Rocket Lake那个新内存控制器实际上是给Alder Lake上DDR5做准备的,特别是加入了类似AMD分频的模式,在现在DDR4上公测翻车也不是没可能(特制最后的BIOS上)。

AMD 锐龙7 5800X 处理器(r7)7nm 8核16线程 3.8GHz 105京东¥ 3199.00去购买?

英特尔(Intel)i7-10700KF 8核16线程 盒装CPU处理器京东¥ 2149.00去购买?


我发现现在这些所谓的「数码圈」实在是极端到了极点。每一次一旦涉及到AMD、Intel处理器的问题,总会是如此。

  • AMD Zen3处理器,游戏本移动端的R7 5800H,在游戏表现下帧率提升不及预期,于是每一个「人」都在叫嚷「翻车了」。他们丝毫不提的是,在生产力分项测试中R7 5800H相比与上一代有大幅度提升,全面超越前代的R7 4800H
  • 英特尔新出的i7 11700K的处理器,在Spec项目上,例如编译等等有提升,他们同样可以完全忽视,而对于游戏帧数下降4%穷追猛打,那就叫嚷「翻车」了

这样的句式——

「尽管11700K在很多SPEC项目上取得了相比于前代较大的进步,但是在诸多游戏测试中,帧率仍然不敌5800X甚至10700K」

本身就是逻辑谬误

你们总假定每一代处理器都要全面超越上一代,否则就是「翻车」了。翻车翻车,年年翻车。翻车的表述从来就是一个情绪化的宣泄,而不是一个正常消费者该有的表述。也难怪数码圈只是小众爱好者的狂欢。他们眼里,帧数降低了五帧,性能偏差了1-2个百分点,那就是天塌下来的事情呀。

从148到142,六帧的差距是天塌下来了,还是卡到不能玩了?在148的基数下,差值为4%,是一个可以无视的差距。

一代处理器,他的生产力表现和游戏性能,从来都不是挂钩的。存在游戏性能下降,但是生产力表现提升,也存在游戏性能提升生产力表现一般的情况。

  • 一个消费者,真的介意这4%的帧数差异,那你就别买
  • 你更看重生产力在多个领域的10%甚至16%的提升,那对你来说英特尔的i7 11700K就是一个好选择

总结:

理性看待,介意4%帧数差异游戏性能的别买。生产力人群直接买。


目前国内的i7 11700K还没有上市,而在售的是i7 10700K;和他竞对的产品,AMD R7 5800X

从价格上看,10700K比AMD的5800x便宜了六七百,价格上便宜了23%

R7 5800X性能更好没错,但他也更贵。这从来就是一个价格、性能的取舍题。

英特尔(Intel)i7-10700K 8核16线程 盒装CPU处理器京东¥ 2449.00去购买?

AMD 锐龙7 5800X 处理器(r7)7nm 8核16线程 3.8GHz 105京东¥ 3199.00去购买?

至于长期活跃于数码圈,每天叫嚷翻车的评价?看都不看。


我不知道anandtech迫不及待的发出这样的成绩是为什么,这些数据之混乱,作为一个这么大影响的媒体,我不知道他需要抢发一些数据还不太可靠的成绩长篇大论一番有什么好处,就算再怎么差多等一下不好吗?anandtech不应该在正式发售解禁之前多研究清楚问题,传达更正确的声音,而不是看到intel成绩差,就迫不及待的跑出来宣布,仿佛有一种就等著看笑话,然后跑的成绩很低,瞬间就达到目的一般,无论编辑什么立场,不能不加核实就抢发新闻。

anandtech成绩的问题:

1,单核频率可能不稳定

从此图可以看出,11700K R20单核577分,10700K单核518分,提升只有11.4%,为什么要说R20,R20恰好对内存和L3缓存的差异很不敏感,往往大多数双通道内存的情况下,就不会再有什么单核分数差异,但是众所周知,rocketlake采用icelake架构设计,ICL R20提升只有11%吗?显然不是,而实测正常睿频到5Ghz的11700K R20单核能达到612-614分

这么一来,577分更像4.7Ghz的成绩,我觉得anandtech再怎么后知后觉,R20分数总该了然于胸,icelake也不至于提升这么少,总不能就盼著RKL分数低,看到这个成绩就急不可待的发出来,,而且这里的意思是,如果能发现单核睿频不正常,说明BIOS的问题可能还有很多,因为我的主板上睿频是没问题的,anandtech的BIOS可能比我用的还要不稳定,至少这个时候,我觉得也没必要就发成绩,如果最后上市,BIOS还有问题,那发出来也可以说正式BIOS就这样,用户拿到就是不行,接下来所以可以对SPEC成绩进行推测

2,SPEC单线程提升

anandtech测试结果为SPEC17int提升10%出头,fp提升16%,而如果把频率实际只有4.7Ghz单核考虑进去,大概就是int提升17%,fp提升24%,当然可能4.7到5.0也不会线性提高成绩,而我使用早期BIOS大概是int 14.6%,fp 22%,这就比较接近了,然后后续BIOS因为一直在调试gear1 gear2的问题,内存性能非常跳跃,所以还一直在等待最终BIOS,再最后测,没想到anandtech在这种情况下就直接把数据发出。

3,游戏性能

RKL缓存比Zen3小很多,很多网游难以抗衡,但是3A游戏表现其实,其实也很迷

育碧游戏有很多基准测试,虽然在Z490上看上去是gear1,但我换Z590,跑在gear2上,刺客信条英灵殿和奥德赛的成绩反而提升了,这应该是比较奇怪的,当然育碧的游戏SKL表现就很好,所以我现在对其表现也无法完全定论。

4,自身编译的程序问题极大

我实在不知道RKL AVX512什么情况下能比10700K AVX/AVX2快6倍,这种严重数据偏差的成绩都看不出来吗?

至少无论好坏,给出一个正确的结论是非常有必要的,作为anandtech这样的媒体,更应该严谨,因为其不应该把追求曝光度放在第一位,因为其影响力已经足够大。

5,功耗问题

RKL是半吞吐FMA处理器,不设置AVX OFFSET,所以AVX512 AVX2都是全核4.6Ghz,AVX2拷机210多瓦,AVX512目前BIOS 250多瓦,anandtech的BIOS似乎AVX512与AVX2功耗的差距过大了。这种问题anandtech也不加以思考,反正只要能显得intel差,立刻发,我甚至可以这么说,anandtech的专业度是值得怀疑的,因为连基本的数据偏差都无法发现,为了展现自己专业的自行编译的程序,更是问题不少,但也一直没有去加以检查和维护

而如果anandtech的290瓦AVX512并不是传统FPU烤机的结果,比如对比的是

也就是我说的6倍于10700K的3DPM的话,那么anandtech的功耗结果就只能说明,RKL AVX512的能耗比非常惊人,用了10700K多不到50%的功耗,换来了6倍性能提升,能耗比提升了4倍,相比5800X能耗比是3倍左右,这个结果就不能说明RKL功耗过高,因为290瓦的时候性能过于夸张


推荐阅读:
相关文章