通常來說,如果一個數據中心伺服器規模超過10萬臺,就可以稱large-scale datacenter,也就是常說的大規模數據中心。大規模數據中心對於網路的要求有很多,但是最突出的就在於穩定和簡單。
這兩點要求本身也有一定的關聯性。比如,大規模數據中心因為網路設備數量多,所以從統計學的角度來說,出故障的頻率也更高。這裡說的故障,不僅包括設備本身出現的硬體軟體問題,還包括因為運維過程中對設備誤操作引起的故障。因此,一個簡單的網路設計,例如採用統一的硬體連接方式,使用有限的軟體功能,能減少故障概率,從而一定程度提升整個網路架構的穩定性。
但是,或許不只對於IT行業,對於任何領域,用簡單的方法去解決一個複雜的問題,本身就不簡單。因此,這一次分析一下如何用CLOS架構,來「簡單的」管理大規模數據中心的網路。
CLOS架構
CLOS架構被廣泛應用在現代的數據中心,因為它提供了數據中心的水平擴展能力和大規模數據中心所需要的穩定和簡單。下圖就是一個最基本的CLOS單元,Spine和Leaf交換機共同組成數據中心網路,其中Leaf交換機作為TOR交換機,連接伺服器;Spine交換機,為Leaf交換機提供網路連接。