Intel 14nm末代服務器增加新指令 10nm又砍掉

　　Intel近日發佈了第二代可擴展至強處理器，代號爲Cascade Lake，工藝還是14nm，架構還是Skylake-SP，而接下來在明年，Intel還將再拿出一代14nm服務器平臺，代號爲Cooper Lake，而且很可能更換接口和主板，再往後才輪到10nm Ice Lake。

　　Cascade Lake在機器學習、人工智能方面做了顯著增強，Cooper Lake則會繼續改進。根據Intel發佈的最新版開發者文檔，Cooper Lake會引入新的AVX512_BF16適量神經網絡指令，也就是支持bfloat16(BF16)格式。

　　bfloat16(BF16)浮點格式介於標準化的半精度FP16、單精度FP32之間，指數位和FP32一樣而多於FP16，但是小數位比FP16更少。

　　它能讓開發者在16位空間內通過降低精度來獲取更大的數值空間，在內存中存放更多數據，減少數據進出空間的時間，還能降低電路複雜度，最終帶來計算速度的提升。

　　這種格式已經成爲深度學習事實上的標準，Google TPU、Intel未來的FPGA及其Nervan神經網絡處理器都會支持，Xeon至強家族支持也在情理之中。

　　Cooper Lake支持的AVX512-BF16指令包括VCVTNE2PS2BF16、VCVTNEPS2BF16、VDPBF16PS，而且都有128位、256位、512位三種模式，因此開發者可以根據需要選擇九種不同版本。

　　不過奇怪的是，Intel每次公佈新指令的時候，都會確認支持的首個架構以及此後支持的架構，比如最初的AVX指令集，支持的架構就標註爲“Sandy Bridge and later”。

　　但這次，AVX512-BF16指令的支持架構卻只寫着“Future Cooper Lake”，並沒有看到慣例的“and later”。

　　這似乎意味着，只有14nm Cooper Lake纔會支持AVX512-BF16，而接下來的10nm Ice Lake反而會砍掉。

　　Intel對此迴應稱：“目前，Cooper Lake會爲機器學習加速(DLBoost)加入Bfloat16指令。除此之外在路線圖內沒有可分享的。”

神秘 24 核心 Intel CPU 現身跑分資料庫，難道是傳聞中的 10 奈米 Ice Lake-SP？