在半個世紀以前,科學家已經發現當氘原子和氚原子聚變爲一個氦原子核和一箇中子時會釋放巨大的能量。由於其能量釋放機理與太陽一樣,所以該工程俗稱“人造太陽”。這就是慣性約束聚變,目的是在可受控的範圍內實現聚變,和平利用人類的終極能源——聚變能。

在中國,用於支撐俗稱“人造太陽”的慣性約束核聚變項目的超級計算機,也有一個超酷的名字:“π”,它是在上海交通大學上線運行的,由浪潮公司設計構建,峯值性能達到263萬億次,也曾位列當時的全球Top500榜單第158名。

如今,一臺性能遠超“π”的全新超算系統,即將在上海交通大學上線,它採用英特爾最新的Cascade Lake 6248 CPU處理器,是國內高校首創,浮點計算峯值速度超過2千萬億次,性能幾乎提升了八倍。

這臺全新的超算系統,也將是英特爾代號爲Cascade Lake的全新至強可擴展處理器發佈後的首個超算平臺落地項目,它的締造者浪潮正在與英特爾,共同演繹智慧計算的速度與激情。

Cascade Lake爲高性能計算和AI而來

英特爾的Cascade Lake可謂是千呼萬喚始出來。去年中旬就已經傳出英特爾將發佈Cascade Lake至強處理器的消息,直到去年11月英特爾才正式公佈了時間表。

4月3日,英特爾正式發佈了Cascade Lake。從公佈的諸多細節看,Cascade Lake支持傲騰數據中心持久內存(Optane DC persistent memory),以及Intel DLBoost加速技術,可加速人工智能深度學習推理。

作爲第二代英特爾的可擴展處理器,它集成核心數量更多,最高可最高達到48核。並實現了對AEP持久內存的支持,使得單CPU最大支持內存容量從1.5TB提高到4.5TB,數據庫、數據倉庫等關鍵計算應用,以及大數據等其他對內存依賴較大的應用,會出現明顯的性能提升;另外,第二代可擴展處理器還增加了VNNI指令,機器學習性能相比Sky Lake提升了14倍。

不難發現,英特爾Cascade Lake,很明顯針對高性能計算、AI相關負載等領域的要求進行了更多的改善。

爲了讓國內客戶最快速度體會到Cascade Lake的高性能,浪潮服務器產品部副總經理陳彥靈不僅參與了Cascade Lake的現場首發,浪潮也同時宣佈:配置全新第二代英特爾至強可擴展處理器的M5系列服務器已經完成測試評估,進入量產階段,可以同步向用戶批量供貨。

首套Cascade Lake超算,將極速落地

浪潮不僅是業內首個宣佈配置Cascade Lake服務器量產的廠家,更是國內首個基於Cascade Lake處理器建設的天梭TS10000高性能集羣系統,在上海交通大學正式落地的廠家,做到這樣的極速背後其實有幾個原因。

第一,浪潮長期與英特爾保持了深層次的合作與溝通,雙方在實驗室階段就有協作。比如在去年11月浪潮和英特爾的聯合實驗室就宣佈:雙方將彙集浪潮與英特爾的優秀工程與研發團隊,專注於AI計算、算法和應用的聯合創新,包括英特爾下一代至強可擴展處理器(代號爲"Cascade Lake")的AI軟件優化。這是浪潮之所以能夠快人一步的基礎。

第二,在客戶層面,浪潮與上海交通大學在高性能計算上有多年合作,贏得了客戶足夠的信任。早在2013年,上海交通大學的一期“π”超算系統就是由浪潮建設的,此係統一直爲全校師生服務,支持重要科研項目,在超算的大力支持下,共有72篇論文得到發表,浪潮深受客戶的信任。

第三,在系統設計層面,圍繞Cascade Lake處理器,浪潮爲上海交通大學進行了全面的系統優化。計算集羣總計656臺雙路節點共26240計算核心,浮點計算峯值速度達到了2.1千萬億次。並且,浪潮採用了業界最大的計算網絡,Intel OmniPath 1152端口核心交換機,爲每一臺節點提供點對點100Gb帶寬的高速網絡,滿足計算和存儲過程中全線速、無阻塞的通信需求。光有計算和網絡還不夠,浪潮還爲用戶構建了一套Lustre全閃分佈式存儲系統,僅5臺存儲節點就能夠提供70GB/s以上的聚合讀寫帶寬,能夠承載臨時計算或生產測試環境下的計算任務,還能應對海量小文件併發的需求。

第四,在系統落地層面,根據上海交通大學的機房考察情況,實際落地的考驗還是很多的。因爲,本次集羣系統需要部署在與π超算系統緊鄰的156平方米機房內,要不影響原系統正常使用,還要充分考慮集羣PUE、供電和機房空間。由於本次超算集羣系統規模巨大,時間緊任務重,浪潮採用了封閉冷通道+LCP列間空調構建了2套浪潮MDC模塊化數據中心,包含30臺機櫃、2臺配電櫃和12臺LCP列間空調,每臺列間空調能提供66kW製冷量,總共能持續爲500kW功率的設備輸出製冷和供電條件。

所以,在國內首個基於Cascade Lake處理器的高性能集羣系統落地,實則蘊含了浪潮全方位的經驗和優勢。

將核心經驗分享開源社區,賦能更多客戶

在浪潮明星產品中,NF5280系列一直是最經典和閃耀的那一個,NF5280M5是爲智慧計算而生,適應各種應用場景要求,可謂是高品質、高可靠、高性能業內最頂尖2路旗艦產品。

通常來講,傳統2U雙路服務器的擴展性和適用性非常有限,但NF5280M5的設計理念恰是可以通過組件升級實現彈性配置,靈活應對不同應用場景的需求。

如浪潮服務器產品部副總經理陳彥靈所說,採用極致化場景設計的M5系列服務器可以更好地將CPU的性能轉變成客戶實際應用效能的提升。浪潮M5服務器分爲關鍵計算、通用計算、融合架構以及應用優化等四個系列,每個系列計算、存儲、I/O各類資源針對具體應用場景進行優化配置,可以爲第二代至強可擴展處理器提供同步配套的內外部I/O、存儲等資源保障,使其發揮出性能等方面的優勢。

毫無疑問,頂級的旗艦必然匹配頂級的處理器,所以浪潮2路通用服務器NF5280M5率先採用了Cascade Lake。據瞭解,此前NF5280M5就達到了英特爾至強可擴展計算平臺的最大擴展性,通過不同類型的模塊組合來面向不同的應用,共有24個內存插槽,其中12個可以支持AEP內存。採用了Cascade Lake之後,可配套擴展網絡和存儲模塊,在分佈式數據庫、在線交易處理、數據倉庫等應用中,性能提升十分明顯。

與此同時,浪潮也在積極推動第二代至強可擴展處理器在開放計算社區的應用。

比如在今年的OCP Summit上,浪潮發佈全球首款面向雲計算場景優化的高密度四路服務器參考設計CraneMountain(NF8260M5),基於Intel下一代可擴展處理器的四路服務器參考設計。

它的創新之處在於:將單個2U平臺中的核的數量增加至112個,內存帶寬增加,可節約的成本達到雙位數。這不僅能爲客戶在計算密度和計算力方面帶來提升和收益,同時也會把原來面對關鍵應用的可靠性、穩定性的設計思想和方案進行傳承和推廣。

這個全新設計將爲雲計算的IaaS平臺提供計算能力更強、密度更高的解決方案,浪潮與Intel將該產品在OCP社區開源,並將相關技術文檔開放到OCP,後續將作爲OCP參考設計可以被其他更多服務器廠商借鑑。

浪潮一直以來都以開放的態度擁抱開源,NF8260M5的成功經驗浪潮沒有選擇獨享,而是分享給其他服務器廠商,並以此來賦能更多的客戶。這也是因爲,浪潮對自己的研發和迭代速度有了充分的自信。

相關文章