記者 | 肖芳

  2019年春晚,百度App順利“過關”,抗住了比平時高几百倍的流量壓力。

  百度官方公佈的數據顯示,春晚期間,全球觀衆參加百度App互動次數達到208億次,春晚數據流量爲每秒峯值5000萬次,每分鐘峯值10億次。邊看電視邊搶紅包對用戶來說只是點點屏幕,但對於保障互動正常進行的數據中心來說,這並不容易。

  百度系統部總監張炳華表示,1月6日,他在內網看到百度拿下2019年春晚獨家互動合作伙伴的消息,第二天就收到了具體的保障任務,很多同事過年回家的計劃被打亂。他把整個保障過程形容爲“數據海嘯、驚濤駭浪”。

  百度陽泉數據中心在春晚紅包互動中發揮了關鍵作用。近日,界面新聞記者實地探訪了百度陽泉數據中心。

  亞洲單體規模最大的數據中心

  AI時代,數據已經像水電煤一樣成爲基礎設施一般的存在,這在10年前難以想象。

  百度智能雲產業智能化業務負責人李碩以一個人臉識別的案例講述了其中的變化:在很多視頻素材中找到清晰的人臉素材,並且跟目標人臉進行比對識別出來。現在,智能設備1秒內就可完成。而在10年前,這種計算量對電腦來說很難做到。

  這個變化的背後是互聯網公司大規模搭設服務器,並發展成爲數據中心。

  目前,百度在陽泉、順義、南京等地區都已部署數據中心,陽泉是三地中最大也是亞洲單體規模最大的數據中心。

  據瞭解,百度陽泉數據中心已建成投產12萬平方米,上線服務器超過15萬臺,有超過300萬個CPU核,存儲容量超過了6EB,可存儲的信息量相當於30多萬個中國國家圖書館的藏書總量。

  陽泉雲計算中心在2012年就開始規劃,整體的設計具有比較強的前瞻性。張炳華介紹稱,當時服務器機櫃就是按40A電流規劃的,但8年過去了,目前IDC供應市場上,主流供應的機櫃基本還停留在20A (4.4kW)。未來5年,CPU的功耗預計會增加3-4倍到300多瓦,單機櫃功率密度會大幅提升到20千瓦-30千瓦,百度未來新建的數據中心,就是按這個功率密度去規劃的。

  在節能方面,陽泉數據中心也做了很多創新。比如在供電上,陽泉數據中心採用市電直供+HVDC offline技術,供電效率達到99.5%;在冷卻上,採用OCU(Overhead Cooling Unit)模塊、液體冷卻等技術,全年超過96%時間實現自然冷卻。

  2018年,百度陽泉雲計算中心年均PUE(電力使用效率,即數據中心總能耗與IT能耗之比。PUE值越接近於1,表示效率越高。)突破了1.10,達到1.09,比全國數據中心平均1.73的水平在基礎設施能效方面提升了88%。陽泉數據中心每年可節省電量達到2.5億度,相當於13萬戶居民一年的用電量。

  天蠍整機櫃服務器

  目前,陽泉數據中心使用了天蠍整機櫃服務器、“冰山”冷存儲服務器、X-MAN超級AI計算平臺等多種百度自研計算系統。其中,2017年上線的X-MAN 2.0,是採用液體冷卻技術的GPU解決方案,散熱效率較高。規模應用後,可以全面去除製冷機組,全面實現無冷機運行。

  陽泉數據中心還使用了百度自主研發的交換機,支持10G、25G的通用計算網絡接入和100G的AI高速無損網絡互聯技術。從數據中心覆蓋用戶時延不超過30ms,從POP點覆蓋用戶的時延不超過10ms,從CDN覆蓋用戶的時延不超過2ms。

  百度智能雲、百度App、百度地圖、智能城市、小度、Apollo等百度系產品都依託於陽泉數據中心提供強勁的計算能力。

  如何保障數據安全?

  雲計算業務正在支撐百度向B端業務拓展。據《財經》報道,百度雲已經成爲百度下一個業務增長點,百度今年爲百度雲制定了百億元人民幣營收目標。

  百度2018年第四季度財報首次公佈了百度雲的營收數據:當季營收11億元,同比增長100%。李碩表示,百度雲現在主體進軍的是金融、互聯網和媒體等行業,同時也在公共安全、通信、能源和交通等行業不斷縱深拓展。

  服務的客戶越來越多,也意味着百度雲必須在服務穩定性和數據安全上做出更多努力。否則,一旦發生不可預知的災難,數據丟失造成的損失將是無法計算的。

  百度陽泉雲計算中心監控中心

  李碩介紹說,在穩定性上,百度擁有一套智能調度系統,採用分層機制,基本能夠做到N+1的服務模式,即一個用戶可以通過多個入口來訪問百度的服務。比如,在陽泉能夠訪問的服務也可轉到西安進行訪問。如果是非常火的數據,百度雲會在多個系統中增加備份,南方的用戶可以在廣州訪問,北方的用戶可以在陽泉或青島訪問。對於相對比較冷的數據,備份會相對少一些,但即使10年沒用到,用戶也可以在使用時能夠快速訪問。

  “隨機關掉百度的任何一個數據中心,我們訪問依舊沒有任何問題,這是上層服務設計需要做到的。”李碩表示。

  百度陽泉雲計算中心通過AI控制,可將網絡故障排查時間縮短至5分鐘。同時,陽泉數據中心設置了7*24時值班,負責現場運營管理、故障處理和維護保養,一旦有突發情況,可以快速反應。

  張炳華表示,百度奉行開放創新、合作共贏的思路,希望通過開源和開放,把中國的數據中心產業生態做好,縮小與國際先進水平的差距,“大家一起想辦法把蛋糕做大,把規模效益做起來,讓每個參與者都是受益者。”

相关文章