知名爆料者APISAK就在資料庫找到了一款Lakefield處理器,型號為 i5-L16G7,5核5線程。

根據資料庫中的信息,這款三星的設備搭載了 i5-L16G7,同時還配備了8GB內存,以及1080p的顯示屏。

CPU部分, i5-L16G7為5核5線程,主頻1.4GHz,平均睿頻可達1.75GH在,搭載了英特爾的UHD核顯,


對於消費者來說,臘雞中的戰鬥機;對於行業來說,很可能是將來x86 CPU體系的奠基者。

Lakefield(LKF)是第一款混合架構的x86 CPU,採用4小核+1大核的設計。

Intel的大小核

手機上ARM很早就使用了大小核設計了,而x86方面,Intel的CPU,近十多年來其實也一直都有兩條線路的核心架構:傳統的Core和ATOM。

Core面向傳統桌面及伺服器應用,下至平板、超便攜筆記本,上至高端桌面、伺服器,中間還有普通筆記本和主流桌面,除了核心數量、緩存大小、內存通道數、PCIe通道數、核顯性能這些差異以外,內核架構幾乎都是一樣的——除了7代以來高端桌面/伺服器的內核支持AVX512指令集以外。單個核心在相同頻率下的性能幾乎都是一樣的。

ATOM則是面向低功耗的嵌入式應用,功耗低,性能也低。初代的Bonnell架構甚至沒有亂序執行亂序執行機制,不支持SSE4,最初上市面向上網本市場的幾款型號甚至禁用了64位支持。而即便是最新的Tremont架構,也不支持AVX指令集。

ATOM的性能到底有多差呢?拿兩個CPU出來對比一下:

  • 奔騰N5030,Goldmont Plus架構,四核四線程,基準頻率1.1 GHz,睿頻3.1 GHz,6W[1]
  • Core M3-7Y32,Sky Lake架構,雙核四線程,基準頻率1.1 GHz,睿頻3.0 GHz,4.5W[2]

NotebookCheck的評分中[3],CineBench R15中,N5030單線程遠落後於睿頻稍低的7Y32;多線程即便是多兩個物理核心,依然落後於功耗更低的7Y32。

LKF的四個小核,採用的ATOM線路的最新架構,Tremont。即便按照Intel的說法,IPC比N5030的Goldmont Plus提升32%,依然落後於7Y32的Skylake架構,更不用說新的SunnyCove架構了。加上L16G7的7W功耗,最高睿頻只有3.0 GHz,整體性能再強有限。和Intel自家的15W,4~6大核,還有AVX、超線程加成的低電壓10代CPU相比,性能都只有更差不會更好;至於和Yes家6~8核的Renoir相比么……

考慮到桌面應用對響應延遲的需要,Intel給LKF加上一個SunnyCove架構的大核,這樣處理界面響應的時候好歹能強點——但睿頻最高也只有3.0 GHz,就算是SunnyCove,大家也不要報太高期望。加上為了大小核設計需要統一指令集,SunnyCove的大核取消掉了對AVX(不止AVX-512)的支持,某些要求AVX的應用可能無法正常運行;堆疊封裝的片上集成8GB內存且不可擴。更何況,可以預見的一段時期內,操作系統、軟體未針對大小核架構進行優化,不見得能把最需要性能的界面處理線程分配到大核上;又或者可能沒有把不需要響應時間的服務線程、後台線程分配到小核上而是佔用了大核的CPU時間片,導致界面處理線程需要和後台線程搶佔大核資源,無法達到期望的性能表現。所以,對於消費者來說,L16G7頂多是臘雞中的戰鬥機。

雖然LKF的大核和支持AVX512的ICL一樣是SNC架構,但不支持FMA/AVX/AVX2/AVX512等指令集

LKF上的新技術

混合內核

事實上,今天的x86 CPU為了絕對性能,犧牲是非常大的。和ARM的2~3 GHz,GPU的1~2 GHz相比,x86的CPU最高頻率基本都在3.5~5 GHz之間,高頻率意味著高功耗,同時為了達到高頻率,需要更低的晶體管密度排布,以及更多級的流水線消耗更多的晶體管。而真正需要低響應時間的一般是桌面應用,因為用戶操作無法預測——而這隻需要有2~4個高頻率高性能核心處理就足夠了。

需要計算性能的多線程應用,往往並不太在乎響應時間,可以用數量更多,但頻率低功耗小的核心去運行,以獲得更高的性能。按照L16G7的7W功耗,4個Tremont核心簡單計算,一個功耗100W的CPU足以容納下57個核心——這還是沒考慮大核佔用的功率。即便頻率再稍高一點達到類似ARM那樣的2~3 GHz,也有望在200W不到的CPU中容納下64個甚至更多的小核,不管是對於目前桌面最常見的3D渲染、視頻編碼,還是伺服器端的大量服務線程、虛擬機/容器集群,都可以提供更高的整體性能,而且不像GPU那樣需要使用專用硬體單元,也比目前為了堆HPC性能採用的SIMD指令集如AVX/AVX512更靈活通用。

Tremont的雙前端

首先,目前還沒看到單獨針對LKF小核的評測成績,但Intel公布的Tremont IPC比Goldmont Plus高32%,其中很重要的一點是雙前端設計。

先看架構圖。

Goldmont Plus架構圖

Tremont架構圖

Tremont和Goldmont+的後端比,差異其實不算太大。8發射埠增加到10發射,多了兩組獨立的Load/Store單元,其它就基本一致了,都是3ALU,1JMP,2FPU。

差異最大的前端,解碼寬度從3提升到6,而且這6路指令解碼是分為兩組3路指令解碼。在程序出現分支的時候,第一組解碼單元對預測執行的分支正常解碼,同時第二組解碼單元將對另一分支先行解碼,包括把不在CPU緩存中而在內存中的分支指令預載入到L1指令緩存。萬一分支預測失敗,馬上就可以替代第一組解碼單元發射指令,無需清空流水線並花費多個時鐘周期填充指令流水線——甚至需要先從內存中花費數百個時鐘周期載入分支中的指令。如果Intel公布的32% IPC屬實的話,我印象中沒有新增執行單元、沒有新增指令的前提下,上一次如此大幅度的單線程IPC提升是20年前的第一代P6架構出現,內部把x86的CISC指令解碼為類RISC指令——集成內存控制器不算。如果將來的大核架構也採用類似設計,很可能CPU的單核性能會有再一次的大幅提升——不過我個人覺得可能會和超線程技術產生衝突,對於提升多線程性能沒太大幫助。

多Die堆疊(Foveros)

現代CPU除了內核外,集成的模塊越來越多,例如GPU、內存控制器、PCIe控制器,對於筆記本、平板用的SoC,還需要集成USB、SATA、音頻、網路控制器等。這些集成的模塊很多並不需要使用昂貴的先進的製程來生產,然而傳統的同基板封裝(例如AMD的Zen2)甚至主板上的獨立晶元,一方面帶來高延遲,另一方面也會佔用更多的面積,再一方面大量數據的遠距離傳輸也需要消耗更多功率。而Lakefield的多Die堆疊,很好的解決了這些問題,表層是10nm工藝的計算晶片(Compute Die),包括四個Tremont小核,一個SunnyCove大核,GPU、內存控制器等;下層則是22FFL(一種基於14nm工藝的低功耗技術)的Base Die,包括各種低速IO、控制模塊、安全模塊等。L15G7上方還堆疊有一層內存晶元。

使用Foveros堆疊的LKF,用於數據傳輸的功耗可以降低至0.2pJ/bit,也就是說傳輸1TB數據,只需要消耗1.6焦耳能量;或者說按照LKF的單通道LPDDR4 4267,最高帶寬34 GB/s計算,用於數據傳輸的功耗只有0.0544W。和通過PCB集成、以及基板封裝集成比較一下:

事實上,Intel除了上下堆疊的Foveros技術外,還有用於橫向互聯的EMIB技術。Foveros適用於多塊低功耗晶元的堆疊,因為多塊晶元上下堆疊會帶來更高的功耗密度,不利於散熱;而EMIB則適用於高功耗晶元的互聯,代價是需要使用更大的封裝面積。通過上下堆疊或者平面互聯,可以很方便的給CPU集成不同的模塊,包括各種專用演算法的硬體晶元、FPGA或者HBM內存等。

未來展望

從LKF上的這些技術,我個人猜測,Intel將來的CPU很可能是:

  • 2~4個高性能高頻率大核,每個大核會使用上Tremont的雙前端,以提供最短的操作響應延遲;
  • 十數個到上百個小核,可能會採用類似Zen2那樣的方式,分成數個小晶片,通過EMIB技術和大核互聯,用於加速通用計算;
  • GB級的HBM內存,提供充足的帶寬;如果需要擴展容量,可以在系統中加裝數十GB到數TB的傲騰內存;
  • 針對不同行業/應用推出特殊型號的CPU,通過EMIB技術與Intel或者第三方生產的FPGA晶元、專用演算法晶元互聯(例如5G modem、NPU、視頻編碼、光線追蹤計算等),擴展功能或者對特定應用進行加速——當然,這些特殊的CPU可能不會零售,也無法自行DIY了只能通過購買特定型號的整機獲取。

如果想更深入了解LakeField,而且英語水平可以的話,推薦閱讀這三篇文章:

https://www.anandtech.com/print/15877/intel-hybrid-cpu-lakefield-all-you-need-to-know?

www.anandtech.com

https://www.notebookcheck.net/Samsung-Galaxy-Book-S-Laptop-Review-Lakefield-with-initial-problems.480990.0.html?

www.notebookcheck.net

https://fuse.wikichip.org/news/2851/intel-unveils-the-tremont-microarchitecture-going-after-st-performance/?

fuse.wikichip.org

參考

  1. ^Intel ARK:Intel? Pentium? Silver N5030 Processor https://ark.intel.com/content/www/us/en/ark/products/197308/intel-pentium-silver-n5030-processor-4m-cache-up-to-3-10-ghz.html
  2. ^Intel ARK:Intel? Core? m3-7Y32 Processor https://ark.intel.com/content/www/us/en/ark/products/97538/intel-core-m3-7y32-processor-4m-cache-up-to-3-00-ghz.html
  3. ^NotebookCheck:Intel Pentium Silver N5030 vs Intel Core m3-7Y32 https://www.notebookcheck.net/Pentium-N5030-vs-m3-7Y32_11531_9062.247596.0.html


lakefield的意義不只是大小核,新的封裝方式也是亮點。lakefiled的高集成度能縮減pcb的面積(想想iphone主板的大小和普通PC筆記本主板的大小)

而atom的意義也不只是省電(能耗比),省面積也是很關鍵的。從這兩點看,可以說是很針對AMD的(畢竟6T的N7HD,又省電又省面積)

為什麼lakefield是1+4?因為現在atom以4核作為一個簇。三個臭皮匠勝過諸葛亮。

tremont的分析anandtech寫過,關鍵就是搬了core的分支預測,為分支做了兩個解碼前端,後端做了浮點整數分離。

這還不是atom的完整形態(所以有開不了AVX的異構問題),等alderlake的goldmont吧。

Jim Keller對atom挺有好感的,等到alderlake,atom才算是完全體。

至於AMD會不會跟進?我覺得不會。

一方面,系統調度方面現在還都是坑,至少要等intel踩完了坑再跟進啊。

另一方面,憑藉台積電的製程,amd現在面積(核心數)、能耗都有一定的優勢,也不那麼需要大小核。


行了,intel的廣告都有了

原回答

根據之前intel的3D封裝介紹,這次的5C5T實際上是1大核加4小核

大核是新的sunnycove小核是下一代的atom通過多種核心一同封裝來達到性能與功耗的平衡是Intel對於多架構和3D封裝的一次試水

主要是用在功耗敏感性的設備上,例如surface這樣的設備,G7的核顯應該會有不錯的極限性能

amd應該不會跟進,畢竟amd連laptap(經指正為laptop)的高端都沒打下,應該沒空搞這個

而且amd不像intel一直有移動(極低功耗)端的布局

intel有5W的core和atom

而amd只有高性能的zen2,短期不大可能去做一個低功耗的核心

我看到有一些吐槽可能是對它的用途有誤解。首先它是一個7W TDP的產品,意味著它壓根不是桌面,甚至定位比移動端的超低電壓更低,這裡的三星+Lakefield其實稍微搜一下就找得到這個產品——三星的Galaxy Book S,直接相關的產品是用了高通8cx的本子。所以Lakefield的直接競爭對手實際上是高通8cx這類SoC。

三星這款產品的定位實際上是和高通本子接近的

Lakefield在發布的時候,所宣傳的就是一個「小」字,通過多die堆疊等等做到了極限小(具體關於Lakefield的技術詳解,可以參考 @木頭龍 的回答)。下面這個板子上,Lakefield的晶元只是其中的一個晶元,完整的可以集成數據機,可以集成內存、存儲等等。

也就是說這麼一塊板子就已經提供了全功能,一個設備的殼內其他位置,就完全留給了剩下的IO介面和電池、屏幕。

私以為Lakefield還是有它的制勝點的,只是絕對不是在Galaxy Book S這樣的本子上,包括高通8cx我也覺得不會成功,很簡單的道理:便宜沒見多便宜,說輕市面上也找的到很輕的主流超低電壓的產品(性能可是碾壓式的)所以,如果以這樣的定位來說,Lakefield和8cx都是辣雞中的戰鬥機。

如果把它放到原本就是矮子裡面挑將軍的環境里,比如不知道大家還記不記得那顆渣到爆的z8350的常用場景里,被用在一些瘦客戶端、國產二三線平板和上網本上,Lakefield應該是可以讓這些設備有翻身之日的,畢竟它的CPU性能就是N5000+額外的Sunny Cove大核(N5000本身就是一個4個Tremont的CPU),和ARM的大小核里那種真正的「小核」還是有所區別的。


AMD 沒必要跟進... 相機圈所謂「底大一級壓死人」, 放在移動 SoC 上就是「工藝先進一級壓死機」.

高通 8CX TSMC N7, 超過 Intel 10nm+ 不是問題, 就是能效上的優勢. 而且還送個 LTE.

865, 6T/7.5T 混合工藝庫下的三級同 ISA 核心, 要性能有性能, 要能效有能效

AMD Renoir, 純 6T, 能效極高, 未來估計搞個 4900U/4900HX 都有可能(這還是在沒有配置核心能效CPPC2的前提下, 之前 matisse 就靠這玩意找出高體質核心超到灰燼了, 後續 XT 還是之前挑出的體質湊的).

而 LKF 是什麼垃圾玩意呢:

給 LKF Renoir 7W 功率, LKF 4 個小核心的性能和 Renoir 一個核心的性能是接近的. 而後者的非核心部分(uncore)大很多, 比如各種 IO/內存控制器/GPU 都會分走一點功耗, CPU 實際就 3-4W. 這其實就說明 LKF 這個小核沒什麼意義, 反而給系統的設計帶來了麻煩. 因為大小核心並不能運行完全一樣的指令. 這對於虛擬化來說也是一個很嚴重的問題. 目前似乎直接砍掉了 AVX 的支持.

至於狙擊 ARM, 我覺得這塊還是 Windows 整個大生態的問題, macOS/iPad OS 動作太多了.

年底的話可能還有 Zen 2 的小核心 Van Gogh, 基本上可以把 LKF 這些輕薄機/入門機/平板機的美夢打成渣.

如何評價小新Pro 13 2020銳龍版??

www.zhihu.com圖標


推薦閱讀:
相关文章