隨著信息系統規模的擴大,數據中心機房無論從面積、配套基礎設施等各個方面都逐漸不能滿足需求。針對這種情況,大多數供電局選擇重建機房。如何將伺服器、存儲、網路等設備遷移到新機房,則是一個較為棘手的問題。

通過分析,發現機房搬遷存在兩個難點。一是搬遷風險大,許多設備早已過保修期且比較陳舊,因此設備安全性和數據安全性的保障顯得尤為重要。二是對用戶有較大的影響,機房遷移對業務工作的開展影響較大,甚至是整個單位的業務中斷,導致嚴重後果。因此,搬遷前要做好大量的準備工作,制定周密的搬遷計劃,提供相應的預防措施、補救措施,最大程度保證數據和應用系統的安全。

什麼是搬遷方案

為了使搬遷對應用系統的影響降至最小,可採用在線搬遷的方式,即建立平滑的網路過渡環境,以數據存儲為核心,保障網路和應用系統的穩定性、連續性,最大程度縮短系統運行的中斷時間。搬遷方案包括以下幾個方面:

  • 設備搬遷方案,主要內容為搬遷設備統計、搬遷配套工具、搬遷日程和人員安排、搬遷後設備位置平面圖。
  • 網路割接方案,包括網路割接流程以及割接前後網路拓撲變化。
  • 系統及數據備份方案,包括備份方式以及時間。
  • 應急方案,包括硬體故障、操作系統故障、資料庫及應用系統故障、存儲設備及數據故障應急方案。

在方案中,首先要確定需搬遷設備清單,並對設備進行分類;其次按照系統劃分設備,安排合理的搬遷次序。核心系統可在週末或者工作日的晚上搬遷,非核心繫統可在工作日搬遷。對於雙機運行的設備可先對備用系統搬遷、調試、正常運行後,再將主機搬遷至新機房。

搬遷步驟

搬遷前制定通知,把搬遷過程的停機安排統一發布,然後提供一個熱線電話和信息部聯繫,負責協調各個專業的搬遷事宜。

  • 信息發布:信息部門提前進行信息發布,告知具體搬遷時間計劃。
  • 網路互連:確定新數據中心機房和舊機房的光纖線路連通.
  • 檢查機房環境條件和可用性:檢查新機房空調、供電、消防、綜合布線等設備正常運行的條件具備,同時進行網路聯通性測試,保證網路的可用性。
  • 應用管理員檢查確認應用是否正常運行,主機管理員檢查確認主機是否正常運行。
  • 數據備份:搬遷前,做好該系統的相關備份。
  • 確認搬遷工具到位。
  • 確認關鍵業務系統相關廠家提供熱線支持或現場支持。
  • 應用管理員退出應用,主機管理員停運主機,再由各搬遷組進行主機的拆卸、清潔、搬遷、上架及網路/KVM接入等工作,設備搬遷過程中應做好設備的防碰撞、防灰塵、防水等,同時必須嚴格按照設備佈局圖、設備背面接線圖完成設備的上架、接線等工作。
  • 主機管理員通電啟動設備,並進行主機測試,應用管理員負責應用測試。
  • 設備正常運行後,各搬遷組及時更新設備及連接線的標識。

建議人員變遷和系統搬遷分期進行。即人員在新大樓辦公,系統在舊大樓,人員辦公穩定後,再逐步遷移系統。

前期準備要紮實

為了減少出錯、順利遷移,需要在搬遷前完成以下工作。

  • 檢查新大樓辦公區環境(電源、傢具、電話、網路)是否具備。檢查數據中心機房環境是否具備(裝修、電源、接地、防雷、綜合布線、溫濕度)等。
  • 新大樓和舊大樓之間的光纖網路保障連接順暢,用至少2對光纖將新大樓聯入舊大樓的IDC數據中心網。
  • 完成設備按照區域網、城域網及IDC內部網建設要求進行搬遷及更改相應配置,從而實現新大樓區域網的搭建,並實現與城域網的聯網。實現新大樓數據中心網路的搭建,並實現和城域網的聯網。
  • 制定新機房伺服器佈局表。在搬遷前要提供詳細的設備搬遷後的機櫃位置擺放圖、設備連線圖以及物理連接圖,從而最大程度保證搬遷的科學有序性。
  • 各系統管理員需做好系統應急預案的準備,並根據系統情況落實是否需聯繫系統廠商到現場協助系統搬遷,以確保及時、妥善地處理設備搬遷可能引起的安全事件。

注意事項

  • 搬遷前新機房要進行光纖、雙絞線的測試工作。舊機房的伺服器導軌是否都與新機房機櫃間櫃相符合,需提前確認。
  • 應用及設備的停運、啟動等操作必須嚴格按照現場操作規程執行;各類設備都有明確的測試方法;準備好應用軟體,包括中間件、資料庫、應用軟體等安裝程序需在搬遷前進行集中準備、歸檔。
  • 數據的備份在系統遷移前,如有條件一定要做好重要系統的操作系統備份(磁帶機備份),確保數據的完整性和正確性。
  • 設備標籤在搬遷過程中,注意對標籤的保護,防止標籤的脫落,尤其是伺服器的小配件及螺絲,拆卸時作好標籤,以免對後面的重組造成影響。
  • 設備關機並切斷電源後,需等到設備內部原件充分放電後纔可拆遷,以盡量減少系統搬遷過程中原件損壞的可能。
  • 責任到人,設備的運輸時要登記、運輸都要有專人負責。
  • 搬遷人員應戴上放靜電手套,設備搬遷過程中盡量做到輕放,避免碰撞;在新舊機房外進行打包和搬遷。
  • 搬遷使用車輛應通過年檢和具備相關安全合格證,駕駛員應擁有駕駛證,並有搬遷車輛駕駛經驗,搬遷車輛運行前駕駛員精神狀態良好。
  • 設備搬遷後必須按原接入情況進行網路及存儲的接入,保證各系統設備的連接方式及運行環境保持不變。
  • 搬遷相關人員要有一個集中辦公的地方,供搬遷期間辦公使用。搬遷過程中出現問題時間長的情況下,需輪班作業,以保證充裕的精力和體力。

應對措施

搬遷過程中易引發硬體損壞、人員傷害、應用故障等三方面的風險,針對他們,至少應採取以下措施。

  • 注意觀察工作人員的身體狀態、精神狀態,若不符合工作要求應安排合適人員替換。
  • 搬遷、拆下、安裝設備應輕卸輕放、過程中要有安全監護人負責全程引導、監護。
  • 運輸前先用包裝紙、海綿等物品加固設備,運輸路線選擇較平穩路段。
  • 用UPS輸出電源進行設備調試、運行等需加電操作。工作場所應安全用電,應使用安全合格的工器具,規範操作,防止誤碰帶電設備。
  • 編製系統重啟作業指導書和系統故障應急操作票,並在搬遷前實際測試操作的可行性,以確保及時、妥善地處理設備搬遷可能引起的安全事件。
  • 搬遷設備前,檢查新舊大樓間光纖通道能否正常通信;重啟原大樓機房伺服器,檢查原大樓機房伺服器節點狀態、應用狀態是否正常,實時數據、實時告警數據、資料庫讀寫功能等是否正常,操作系統是否正常、磁碟空間及磁碟文件是否能正常讀寫;對重要的數據、網路配置等進行備份,便於及時恢復配置或數據。
  • 是系統無法啟動時,逐步從應用軟體、操作系統、網路配置、硬體設備等逐步排查故障。安排小型機操作系統、Oracle資料庫廠家現場值班,處理意外問題。

推薦閱讀:

相關文章