今年6月,北京亦莊的某數據中心機房柴油機的起火事故給我們各大機房好好上了一課,讓人不禁心有餘悸。這也讓我們更加註重機房的防火策略和設備。

首先我們要知道數據中心起火的原因。數據中心作為提供信息資源服務的基地,應當具有非常好的機房環境、安全保障。數據中心火災的特點是:散熱困難、煙氣量大、用電量大、電氣火災居多、火災損失大、撲救困難大、節點易燃燒。

在數據機房發生的事故當中,火災約佔事故總數的80%,主要包括以下幾種:1.電子計算機本身起火;2.配套設備或附屬裝備起火;3.空調設備或電氣設備起火;4.外來火災侵擾。同時對於起火的原因,據日本計算機製造商對用戶的調查表明:1.計算機故障佔3.4%;2.交換機與配電箱故障佔6.9%;3.設備裝配錯誤佔10.2%;4.調節器故障佔10.3%;5.火焰蔓延引起的第二次火災佔17.1%;6.與計算機無關的其他原因造成的火災佔52.1%。

那麼,怎樣才能避免機房起火或者降低起火的概率呢?

第一點,選址的好壞很重要。據悉,北京市發改委於2014年出臺了產品禁止目錄,其中將PUE大於1.5的數據中心列為禁止項目,2015年8月又進一步限制在城六區新建數據中心。由此可見,數據中心是的建設選址不僅要保證建築物的質量,還要保證配套設施的完備性和長期運轉的高可靠性,並要考慮到在用電高峯季節臨時性限電政策對數據中心帶來的影響。

以Facebook公司為例,該公司計劃在美國亨茨維爾北部建造一座全新的數據中心,看中的正是當地可提供可靠的可再生能源、強大的本地基礎設施。在國內,我們杭州梅花樓數據中心機房位於錢江四橋南岸,雙路市電冗餘供電,並採用大功率美國原產柴油發電機組提供可靠的後備供電能力。機房採用大功率進口原裝空調設備,先進的機房專用空氣調節系統採用下送風、上迴風方式,精確控制機房空間的溫度及濕度,並且具有專業的維護隊伍。

第二點,冷卻系統的配置。大多數的數據中心冷卻和電源的容量如今都已過度配置,通常所部署冷卻容量比必要的冷卻容量要高出三倍。根據調研機構Gartner公司的調查,數據中心40%的冷卻成本被浪費。如何更科學合理地節能降耗,成為擺在數據中心運營商面前的難題。

這就需要一些切實可行的方案,諸如機房採用封閉冷通道以及精確下送風方式,地板結構下沉,機櫃熱通道背靠背,優化氣流組織,避免冷熱氣流混合,提高製冷效率;採用雙環路管道,提高空調系統安全和可靠性;利用天然發電機餘熱加熱水,給溴化鋰製冷機提供熱源,回收利用了餘熱,達到了節能減排目的。

第三點,運維管理。工欲善其事必先利其器——可靠的電力保障與高效節能的冷卻系統正是數據中心提供穩定服務的基礎,然而光有硬體和技術支撐還遠遠不夠。對於數據中心發生的故障,行業專家認為故障多發的原因還是在運維管理上,正所謂「三分技術,七分管理」,數據中心的故障大多源自於人禍。

運維工作對數據中心來說至關重要,關乎整個數據中心業務的正常運行。一旦突發故障,具備一定的專業技能和應急能力的運維團隊可及時對故障原因作出準確判斷並迅速找出解決方法,避免宕機風險,從而達到防微杜漸的效果。

面對數據中心業務模式日益高端化,杭州梅花樓機房的業務種類由當初的網站和伺服器託管、應用託管等基礎業務,進行了更大範圍的延伸拓展,其增值服務覆蓋了網路/伺服器實時監控及告警、現場軟/硬體支持、入侵檢測、流量清洗、鏈路測試、網路故障排除、巡檢監控等多項內容,可以滿足客戶多樣化及垂直專業化服務的需求。

0

推薦閱讀:

相關文章