遊戲性能是比較複雜的,本身就相當於一個混合負載,不同引擎還有不同的特性。參考之前zen3 apu性能提升微弱,甚至L3速度修復後依舊微弱,這還得進行更詳細的分析纔行。


緩存性能下降的話,L1、L2的延遲增加是意料之中的(容量增大的後果,ICL可復現),L3的延遲增加的確比較奇怪,不知道是不是因為14nm的布線限制導致的。

理論上BIOS原因導致ring頻率不穩定也是有可能的(RKL要求電壓更高,和zen3類似也會對類似EDC的電流指標有更高要求),但延遲測試的負載不大啊,不該不穩定吧。而且功耗測試裏也提到說能穩定4.6G?

如果說是微碼導致L3延遲增加,我倒是比較懷疑。因為都出正式版了,bug應該修得差不多了,真要期待提升也是針對硬體設計存在的問題做更好的workaround吧。


spec測試編譯器還是用的clang10+avx2(針對haswell),相比ICC可能發揮不了新架構最佳性能,但也算是為了橫向對比做的妥協。換個角度,如果一個架構需要更多精力做專屬優化才能獲得好成績,那也算不上什麼優點。

spec成績還是低於zen3,考慮到之前TGL-U的表現,倒也不是很意外。不過要注意的是spec總分是「幾何平均值[1]」,所以不適合按照線性去算分差的,算相對百分比更合適。

比如看specint總分,zen3比RKL高0.7看著很嚇人,但其實也就是高10%,所以這個成績對頻率還是比較敏感的(所以zen3相比zen2提升巨大,頻率+緩存+IPC三管齊下)。如果是單核頻率不夠穩的話那結果很好解釋,如果單核頻率是穩定的話那的確不是很好看,只能說任重而道遠。

具體看specint子項,zen3相對RKL刷分的主要是520、548、557三項,每個都高了23%~25%。但參考這篇論文[2],其中520和557還是對緩存大小挺敏感的,大於14M的緩存依舊能比較明顯地降低LLC miss。

PubMed Central Image Viewer.?

www.ncbi.nlm.nih.gov

L3大小,zen3有32M而RKL只有16M,而且後者還是包含式,實際利用率會更低些(論文研究的是SKL-X,用的非包含式L3)。可以等等看TGL-H的測試,TGL-H8核會有24M非包含式緩存,加上顯著更高的L2,理論上這兩項也會有更高的成績。

505和541兩項zen3也有10%左右的優勢,參考這篇論文的話[3],這倆是branch miss最高的兩項,同時541的L3 miss也最高,無腦猜測分支預測和緩存方面intel還是存在些許劣勢。

而從歷史角度上看,zen2/3依舊有著更多ALU埠(intel選擇int/vec復用而把loadstore拆分得更細),更大的uopcache(而且限制似乎更少帶寬也更高),更高帶寬的L3。當然紙面數據不見得能反映實際性能,intel可能是綜合了workload特性才做出這樣的設計。不過如果workload本身有偏差的話,精明反而容易被精明誤吧。


至於說功耗,14nm還能指望有什麼好看的功耗嗎?10nm都打不過對面的N7HD啊。不過拿avx512的功耗去比較還是不太合適,幹更多的活耗更高的電,天經地義。只比較AVX功耗的話,感覺增加幅度也不算大(考慮新架構堆了規模)。

其實參考TGL-U的頻率功耗,10sf的功耗也不好看,再加上密度上差於N7,我感覺intel陷入了無腦暴力追求性能的窘境,為了榨出最後一點性能,寧願犧牲功耗和密度。CPU團隊應該向GPU團隊學習,gen12對比gen11密度增加性能增加功耗不變,這纔是更理想的前進方向。

參考

  1. ^幾何平均值 https://zh.wikipedia.org/wiki/%E5%87%A0%E4%BD%95%E5%B9%B3%E5%9D%87%E6%95%B0
  2. ^Memory hierarchy characterization of SPEC CPU2006 and SPEC CPU2017 on the Intel Xeon Skylake-SP https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6675054/
  3. ^A Workload Characterization of the SPEC CPU2017 Benchmark Suite https://uweb.engr.arizona.edu/~tosiron/papers/2018/SPEC2017_ISPASS18.pdf


現在說倒退言之過早

這是Anandtech的一份特殊評測,我不知道有多少人認真看完評測說明:

A站和Intel是簽了NDA(Non-Disclosure Agreement,保密協議)的,而Intel的11代桌面(Rocket Lake, RKL)解禁時間是3月30日,理論上在這個日期之前,A站是不能公開任何Intel所提供且未公開的RKL信息的。

但這次的RKL,前幾天德國的零售商Mindfactory不知出了什麼問題,提前銷售出去一批i7-11700K,據說大概有120顆,A站搞到了一顆。

有關這顆CPU的一切信息,因為並非Intel提供,不受NDA約束,所以A站可以提前做這麼一期評測放出來。但裡面還是有部分Intel提供的信息受NDA約束而不能公開的,例如很重要的一個信息:評測平臺使用的主板及BIOS版本

CPU本身是零售渠道出來的正式版,B0步進,理論上不會有什麼問題。但主板和BIOS就不好說了。本來在產品公開發售前向媒體提供評測產品,就是發售前的最後一個非公開測試環節。畢竟CPU、主板廠商都不可能用市面上所有的硬體、軟體組合全部測試一遍,提前把產品給媒體評測也是擴大測試範圍、增加測試用例的一種手段。如果在媒體評測中出現什麼問題——包括性能達不到預期效果,在公開發售前還有解決和修正的機會,甚至不排除因為問題很嚴重又無法在發售前解決而推遲發售的可能。

就A站的這份評測數據, @JZWSVIC 根據CineBench R20的單線程成績,懷疑最高睿頻5.0 GHz的11700K測試時只是工作在4.7 GHz,我覺得很有道理。那麼如果是主板的睿頻機制有問題的話,Ringbus/LLC的頻率是否工作在正常頻率,也是要打個問號的。

有些朋友可能沒有留意,Intel的CPU有一個Uncore頻率(在某些主板BIOS中可能叫Ring頻率)。顧名思義,UnCore就是CPU中除了CPU核心以外的部分(不含核顯),就Intel的CPU來說,包括三級緩存(也叫末級緩存,Last Level Cache,LLC)、環形互聯匯流排(Ringbus Interconnect)、內存控制器、PCIe控制器等模塊。在Intel的桌面、筆記本CPU中,為了提供最高速的響應速度,UnCore部分的工作頻率往往高達4 GHz以上,例如10代旗艦的10900K,Uncore頻率最高是4.3 GHz。

這幾代Intel的CPU,雖然因為工藝問題,一直使用14nm和老舊的Skylake架構,但Zen3上市之前一直是遊戲表現最好的CPU,即便Zen3上市後,相當部分遊戲中依然是Intel更強,三級緩存、核間互聯、內存延遲性能是很重要的原因(也和Zen2/3使用獨立IO Die,且Infinite Fabric匯流排頻率只有2 GHz不到有關)。即便說RKL用14nm工藝來生產為10nm設計的核心架構,比10代的Skylake核心晶體管數量多了核心面積大了,需要更長的導線聯通,只要Uncore部分頻率沒有大幅下降,不應該有這麼大的性能倒退。

如果說一級緩存、二級緩存因為容量增加,延遲高了一個時鐘週期算是正常的話,LLC容量沒有增加反而延遲高7.5個週期,17%的性能下降;內存延遲高了34個時鐘週期(內存還從DDR4 2933升級到DDR4 3200),13.7%的性能下降就很不正常了。LLC、內存延遲高了這麼多,其它測試成績,尤其是很看重內存延遲的遊戲測試成績不佳就是自然而然的事了。

除非有其它媒體公開一致的評測成績,或者A站給出測試時的核心、Uncore頻率曲線,否則我更傾向於這個成績是A站測試平臺的問題,而非RKL的正常表現。


Anandtech那個11700K應該用的不是最終版的BIOS,測試成績應該會和正式版有些差異。

之前就說首發評測搞不好會翻車,這個比首發更早的測試翻車了就更正常了。RKL一直被說現在有些BIOS微碼問題,看這個評測也好像內存性能有些問題。 ???

具體看這裡:如何評價Intel i7 11700K?

就現在這個非正式版的表現,是在可預期結果內的~ Rocket Lake的Ringbus在現在微碼上有問題,結果也對得上。

RKL的Ringbus物理上都變短了,這個成績挺不符合預期的。等正式版,再來判斷是硬體倒車了,還是現在優化問題。

當然,Rocket Lake可能到正式版的內存性能也得不到改善,這個倒車在Tiger Lake裏有點苗頭。Rocket Lake畢竟是真的換了內存控制器,那個Gear 1和Gear 2搞不好第一次弄就弄翻車。Tiger Lake和Rocket Lake的這塊改進都在給Alder Lake鋪路。

如果說Rocket Lake那個新內存控制器實際上是給Alder Lake上DDR5做準備的,特別是加入了類似AMD分頻的模式,在現在DDR4上公測翻車也不是沒可能(特製最後的BIOS上)。

AMD 銳龍7 5800X 處理器(r7)7nm 8核16線程 3.8GHz 105京東¥ 3199.00去購買?

英特爾(Intel)i7-10700KF 8核16線程 盒裝CPU處理器京東¥ 2149.00去購買?


我發現現在這些所謂的「數碼圈」實在是極端到了極點。每一次一旦涉及到AMD、Intel處理器的問題,總會是如此。

  • AMD Zen3處理器,遊戲本移動端的R7 5800H,在遊戲表現下幀率提升不及預期,於是每一個「人」都在叫嚷「翻車了」。他們絲毫不提的是,在生產力分項測試中R7 5800H相比與上一代有大幅度提升,全面超越前代的R7 4800H
  • 英特爾新出的i7 11700K的處理器,在Spec項目上,例如編譯等等有提升,他們同樣可以完全忽視,而對於遊戲幀數下降4%窮追猛打,那就叫嚷「翻車」了

這樣的句式——

「儘管11700K在很多SPEC項目上取得了相比於前代較大的進步,但是在諸多遊戲測試中,幀率仍然不敵5800X甚至10700K」

本身就是邏輯謬誤

你們總假定每一代處理器都要全面超越上一代,否則就是「翻車」了。翻車翻車,年年翻車。翻車的表述從來就是一個情緒化的宣洩,而不是一個正常消費者該有的表述。也難怪數碼圈只是小眾愛好者的狂歡。他們眼裡,幀數降低了五幀,性能偏差了1-2個百分點,那就是天塌下來的事情呀。

從148到142,六幀的差距是天塌下來了,還是卡到不能玩了?在148的基數下,差值為4%,是一個可以無視的差距。

一代處理器,他的生產力表現和遊戲性能,從來都不是掛鉤的。存在遊戲性能下降,但是生產力表現提升,也存在遊戲性能提升生產力表現一般的情況。

  • 一個消費者,真的介意這4%的幀數差異,那你就別買
  • 你更看重生產力在多個領域的10%甚至16%的提升,那對你來說英特爾的i7 11700K就是一個好選擇

總結:

理性看待,介意4%幀數差異遊戲性能的別買。生產力人羣直接買。


目前國內的i7 11700K還沒有上市,而在售的是i7 10700K;和他競對的產品,AMD R7 5800X

從價格上看,10700K比AMD的5800x便宜了六七百,價格上便宜了23%

R7 5800X性能更好沒錯,但他也更貴。這從來就是一個價格、性能的取捨題。

英特爾(Intel)i7-10700K 8核16線程 盒裝CPU處理器京東¥ 2449.00去購買?

AMD 銳龍7 5800X 處理器(r7)7nm 8核16線程 3.8GHz 105京東¥ 3199.00去購買?

至於長期活躍於數碼圈,每天叫嚷翻車的評價?看都不看。


我不知道anandtech迫不及待的發出這樣的成績是為什麼,這些數據之混亂,作為一個這麼大影響的媒體,我不知道他需要搶發一些數據還不太可靠的成績長篇大論一番有什麼好處,就算再怎麼差多等一下不好嗎?anandtech不應該在正式發售解禁之前多研究清楚問題,傳達更正確的聲音,而不是看到intel成績差,就迫不及待的跑出來宣佈,彷彿有一種就等著看笑話,然後跑的成績很低,瞬間就達到目的一般,無論編輯什麼立場,不能不加核實就搶發新聞。

anandtech成績的問題:

1,單核頻率可能不穩定

從此圖可以看出,11700K R20單核577分,10700K單核518分,提升只有11.4%,為什麼要說R20,R20恰好對內存和L3緩存的差異很不敏感,往往大多數雙通道內存的情況下,就不會再有什麼單核分數差異,但是眾所周知,rocketlake採用icelake架構設計,ICL R20提升只有11%嗎?顯然不是,而實測正常睿頻到5Ghz的11700K R20單核能達到612-614分

這麼一來,577分更像4.7Ghz的成績,我覺得anandtech再怎麼後知後覺,R20分數總該瞭然於胸,icelake也不至於提升這麼少,總不能就盼著RKL分數低,看到這個成績就急不可待的發出來,,而且這裡的意思是,如果能發現單核睿頻不正常,說明BIOS的問題可能還有很多,因為我的主板上睿頻是沒問題的,anandtech的BIOS可能比我用的還要不穩定,至少這個時候,我覺得也沒必要就發成績,如果最後上市,BIOS還有問題,那發出來也可以說正式BIOS就這樣,用戶拿到就是不行,接下來所以可以對SPEC成績進行推測

2,SPEC單線程提升

anandtech測試結果為SPEC17int提升10%出頭,fp提升16%,而如果把頻率實際只有4.7Ghz單核考慮進去,大概就是int提升17%,fp提升24%,當然可能4.7到5.0也不會線性提高成績,而我使用早期BIOS大概是int 14.6%,fp 22%,這就比較接近了,然後後續BIOS因為一直在調試gear1 gear2的問題,內存性能非常跳躍,所以還一直在等待最終BIOS,再最後測,沒想到anandtech在這種情況下就直接把數據發出。

3,遊戲性能

RKL緩存比Zen3小很多,很多網遊難以抗衡,但是3A遊戲表現其實,其實也很迷

育碧遊戲有很多基準測試,雖然在Z490上看上去是gear1,但我換Z590,跑在gear2上,刺客信條英靈殿和奧德賽的成績反而提升了,這應該是比較奇怪的,當然育碧的遊戲SKL表現就很好,所以我現在對其表現也無法完全定論。

4,自身編譯的程序問題極大

我實在不知道RKL AVX512什麼情況下能比10700K AVX/AVX2快6倍,這種嚴重數據偏差的成績都看不出來嗎?

至少無論好壞,給出一個正確的結論是非常有必要的,作為anandtech這樣的媒體,更應該嚴謹,因為其不應該把追求曝光度放在第一位,因為其影響力已經足夠大。

5,功耗問題

RKL是半吞吐FMA處理器,不設置AVX OFFSET,所以AVX512 AVX2都是全核4.6Ghz,AVX2拷機210多瓦,AVX512目前BIOS 250多瓦,anandtech的BIOS似乎AVX512與AVX2功耗的差距過大了。這種問題anandtech也不加以思考,反正只要能顯得intel差,立刻發,我甚至可以這麼說,anandtech的專業度是值得懷疑的,因為連基本的數據偏差都無法發現,為了展現自己專業的自行編譯的程序,更是問題不少,但也一直沒有去加以檢查和維護

而如果anandtech的290瓦AVX512並不是傳統FPU烤機的結果,比如對比的是

也就是我說的6倍於10700K的3DPM的話,那麼anandtech的功耗結果就只能說明,RKL AVX512的能耗比非常驚人,用了10700K多不到50%的功耗,換來了6倍性能提升,能耗比提升了4倍,相比5800X能耗比是3倍左右,這個結果就不能說明RKL功耗過高,因為290瓦的時候性能過於誇張


推薦閱讀:
相關文章