-


我覺得吧,題主可能想問的是。選擇高(相對)性能集群比超高性能單機的優勢是什麼?

其實,大多數人對自己需求的硬體認知是不足的,作為管理員,用戶提出需求的時候,想要配置越高越好的計算機,但實際上拿去做1+1的運算,1%的佔用都達不到。所以,我們分配的時候,先從低配置給,如果夠用了,就沒必要浪費更多性能,不夠再逐級擴容。一台高性能主機,足夠許多用戶分配使用了。

那麼如果不採用集群而使用一台超高性能伺服器(伺服器不能熱插拔u和內存,假設已經插滿),cpu和內存足夠服務無數客戶,那麼相應的,主板帶寬,硬碟讀寫,網路,都需要相應的擴大,不同的業務,對於不同硬體的需求差別很大,很難提前預計容量,那麼我們這台超高性能計算機,是不是所有的硬體,性能都需要超高,浪費也超高。

Ok,我們公司有錢,不在乎浪費,就想要一台超算一樣性能的超級計算機。

為什麼不是超算呢,因為超算也是集群構成,不符合一台計算機的要求。

假設有一家NB的公司,造了一台超算性能的單計算機,裡面成百上千的cpu,內存,啥的。

這麼高性能的計算機,業務肯定都能滿足了,可能比正常的數據機房體積還大,不過沒關係,誰讓咱們公司有錢呢,把公司20層足球場拆了拿來放超級單機。

我們這台7×24小時的單機超算,平穩運行了三年,突然跳了個風扇故障燈,咱們這麼高精尖的設備,居然還會壞,沒辦法啊,這玩意一般工程師都不會修,也沒見過啊,找廠家吧。

廠家工程師來了,伺服器上打開個門,人進去修,真高端哈,在伺服器上留個檢修口,修好了風扇,都挺開心。廠家工程師拿著單次上門服務費,也不多,5萬塊,禮貌的道別。

第四年,期間出過一些小問題,這計算機居然有硬體熱插拔技術,真NB,領先整個行業,不過還好都讓原廠工程師來搞定了,硬體更換雖然麻煩,主板都是分區域的,哪個區壞了單獨維修,那一個主板模塊都趕上一個2u伺服器大了,普通工程師沒法修,但是咱們有錢嘛,原廠服務就完了。不過跑了四年了,業務佔用,容量都不斷上升。

另外說一下,這台超級單機擁有:超級單機高可用容災系統,所有數據都擁有額外兩個備份在不同陣列,保障了數據安全。計算資源也有額外兩份預留。也就是說,當性能,數據接近整機性能,數據33%時,整個伺服器就不能再提供更多資源了,雖然這個演算法不好,沒有有效利用,沒有合理分配存儲等級。但是,這台超級單機可以同時壞三分之二的cpu,硬碟,內存,之類的硬體,也不會宕機,非常可靠。

公司順便收購了附近一座發電廠來單獨為超級單機提供備電。

四年多了,性能佔用距離三分之一還差的遠,但是存儲已經不足了,也不知道為啥這堆業務佔用存儲那麼多,平時用起來從來沒刪過內容就是了。

存儲性能不足,只能

更新設備了!

高層領導對於超級單機只能用4年非常不滿,畢竟投入了上千億。

你沒有告訴領導,性能其實還很多,但是存儲不足沒法單獨擴容。而是吹噓了公司壯大,數據,業績太多,比預計增長了好幾倍。領導們很開心,很認同,於是批准了了更新設備。

聯繫伺服器供應商,供應商很快給出了最新款超級單機2號,性能提升了3.5倍,價格只提高了1.5倍。超值啊,不過供應商要求和原來的超級單機建立超級網路交換系統才能熱遷移。

超級網路交換系統,加超級單機2,也需要一座半足球場大小才行。20層左右都沒這麼大空間放置,超級通信系統又不能太遠。

領導一思考,咱們也不能建兩個樓,那多不好,乾脆把現在這個樓擴寬,20層以下,不,整個大樓擴寬成原來的2倍,不,三倍。這樣咱們這一座超級大樓才配得上咱們公司。

擴容大樓在不斷燒錢的情況下,也需要6個月才能完成。但是數據即將滿載。

實在沒轍,你讓伺服器供應商把數據限制解開,這樣短期溢出也可以有一份備份,想來也不會發生什麼危險。

另外,全公司通告,要各項目負責人推動清理無用的數據文件,儘可能讓數據存儲夠用。不過四個月的時候,數據也嚴重超出1/3了,還好你有先見之明,解除了限制。

終於,五個多月,擴建即將完成,新伺服器可以上架,不對,上樓,舊的可以退役了。

天空一道閃電,擊中了20層,大概是20層金屬太多,強過避雷針吸引雷電。

伺服器損壞了四分之一,原本這樣程度的損壞是沒問題的,但是偏偏你要求解除了限制,有一些相鄰的數據塊被摧毀。還好不是很多。

對公司業務影響大概相當於三個月的數據泡湯了,領導雖然也很不開心,但還是安慰了你,畢竟天災人禍不可抗力。顯然領導是不知道這種災難其實也可以避免的。

6個月到了,大廈擴建完工,供應商運送超級單機2號上樓對接,一切順利,此時原來的超級單機警告報錯已經超過三分之一設備問題。

在蠻長的一個月數據熱遷移後,公司終於把業務轉移到了新平台,超級單機2號。

超級單機 被廠家以一張99.6折有效期5年的購新機優惠券回收。

超級單機2 平穩運行了三年,監控運維平台報警,風扇壞了一個。

40年後,有一個邋遢大叔在酒館吹NB,我當年在一家公司當研發。負責一個超級集成項目,用無數台計算機集群,來模擬成一台單機給客戶...........要不是第三代產品最後被回收公司曝光,公司破產,我現在也不會成這樣,你們都得仰望我.....

希望大家喜歡這個腦洞。

其實就是,單機,難擴容(總有上限),難維護(不能停機,不能熱插拔部分硬體),難備份(容災能力差),之類的,問題太多了不一一列舉。

伺服器,最重要的就是保證任何情況下服務不中斷,不是嘛。


講真,說再多理由都源於一個字,貴。

小型機比同樣算力的x86伺服器集群貴很多,從硬體到軟體全方位的貴...


如果你只有一台設備,遇到檢修什麼的怎麼辦。哪怕你能熱插拔,我一杯水潑上去怎麼辦。


為了後期方便維修,

你家裡難道所有燈都用一個開關?一個道理


數據中心的本質就是給伺服器插了更多的內存和CPU啊


插不了這麼多,就算插的了,性能也不是疊加的。性能是有上限的。2個v8的發動機就是v16的動力了?


去怪intel吧,他們現在的cpu才支持4路(也就是能插4個cpu),想插更多也不行啊。


所謂數據中心就是一個許多伺服器個體的資源池 ,單台伺服器是一個個體。放到資源池裡面的東西可以享用集群,冗餘,高可用等,保證服務的連貫性。

單台伺服器硬體損壞或者性能不足,就要停機處理了,服務就不能連續。

這就是我們要建立數據中心的原因。便於管理調度,變於擴展和檢修。


推薦閱讀:
相关文章