後來AMD自己在農業機械里又跳了一次一樣的坑,真是諷刺。


microprocessor report的一篇報告里的評價"Almost every company has produced one or two subpar architectures: Intel had the P4 and Itanium, IBM had the Power6 and Cell, ARM had the Cortex-A8, Sun had the UltraSparc V, and Nvidia had the NV30"

奔4估計給大部分人留下的最深的形象就是高頻低能,31級的流水線。

其實奔4的微架構最早的netburst的流水線大約是20級,和現在的Intel處理器相比基本差不多,不過由於沒有解碼過程,實際相比於當前的Intel處理器還是多了5,6級。netburst相對於p6來說是一個全新的架構,並且引入了不少新功能(包括一些當時比較新的成果):trace cache,explicit rename,seletive replay,2倍速alu,極短的load to use延遲。從設計層面看起來應該是一個比p6更好的微架構。不過最終性能卻不理想,各種原因都有吧,比如使用了trace cache後去掉了L1指令緩存,造成trace cache缺失時延遲太長,trace缺失時傳統的解碼通路只能翻譯兩條指令,這就退化成一個兩發射的cpu了,trace預測器準確率低於傳統的分支預測器,太小的L1數據緩存等。

至於後面的31級流水的prescott,應該是市場原因吧,當時做個新架構來不及了,當時很多消費者對於cpu性能是用頻率來衡量,所以就選擇堆頻率。

不過也算為Intel後面的架構積累了一些技術吧,比如現在的uop cache也是存的解碼後的內容,不過結構更簡單,存的內容也更簡單,並且還有L1指令緩存做後備,是一個比較合理的實現。


人類從歷史中,學到的唯一教訓,就是人類無法從歷史中學到任何教訓。

P4架構是2000年代消費級CPU領域的大失敗,P4的失敗說明片面追求高主頻而加長流水線(P4有31級,而P3才14級,同期K8也不過20~22級)是不可取的。這也是當年P4的大失敗。

2010年代AMD也又一次掉入類似的深坑中,這就是推土機系列,即片面追求多核而不惜削弱單核(一開始甚至趕不上K10.5)也是不可取的。

不過P4和推土機也給後輩留下了少量遺產。P4中後期的超線程技術在nehalm(一代i系)上重新發揚光大,並保留至今;推土機的模塊化也利於後來的zen系列堆核。

總而言之,P4和友商後來的推土機系列一樣,都是2000年以來20年中消費級CPU領域中兩次不成功的實驗,相關廠商也為此交了不少學費,但它們身上的技術也啟迪了後輩(HT對應core i系和模塊化對應zen系列)。


不顧流水長度

一味提高頻率


我第一台電腦就是奔四 3.0GHz處理器。AMD出的應該是K8。AMD主打64位奔四主打高主頻。後來傳聞英特爾研發過一款單核4GHz處理器後來失敗了開始搞酷睿多核處理器。AMD64位這一點點優勢很快被酷睿超過就再沒挽回局面。


買過P4E-2.8,主板是華碩的當時第二貴的型號,每天死機數次,後悔死了,不如買P3C-2.4了。


推薦閱讀:
相关文章