當網站的訪問量大了就會考慮負載均衡,這也是每一個架構師的基本功了,其基本地位就相當於相聲里的說學逗唱,活好不好就看這個了
傳統的負載均衡思路是單點的,不管你是硬體的還是軟體的基本都是這樣的原理,如下圖所示:
對於一般的需求來說,這樣的架構基本就可以解決問題了,而且維護起來也相對簡單,大多數公司也都是這麼乾的。
就如同上圖所示,傳統思路也存在非常明顯的局限性。
也就是說,網站的響應速度很大程度上局限於負載均衡節點的能力,而且一旦負載均衡節點本身掛掉的話,整個網站就完全癱瘓了。
後端的服務可以水平擴展,但是對於單個節點來說就算你再增大機器的配置也是有極限的,而且這也不符合互聯網技術的發展規律。
CDN是怎麼做的
作為互聯網上承載大部分流量的一大基礎設施,CDN對負載分流的解決思路很具有啟發性,如下圖:
從上圖可以看到,用戶的訪問被分流了,所有的請求不再是聚集到一個節點上,而是被分擔在了各個合適的節點上。
這樣即使存在單點故障,也僅僅只會影響到一部分用戶,況且我們還可以使用其他手段做故障轉移。
同樣的做法也可以借鑒到傳統的 BS 架構中,我們也可以把用戶的請求直接分流到不同的伺服器上,而不必經過一個統一的節點中轉。
這個分流是通過什麼做到的呢?
答案就是:DNS
你知道DNS是怎麼工作的嗎?
大部分人可能天天都用著DNS卻不知道它的基本原理,你可能知道我們訪問互聯網需要查詢dns伺服器,就是下面的這個玩意
我們只需要問它域名所對應的ip地址就行了。
但事情真的這麼簡單嗎?它是怎麼知道這個域名所對應的ip地址呢?
其實dns系統是一個典型的樹狀架構,上圖所示的dns伺服器其實應該叫dns緩存查詢伺服器,它是為了減輕互聯網上dns查詢的負載所設計的。
如果你的請求沒有命中緩存,那麼這個緩存伺服器就會自己進行一次標準查詢,然後再把結果緩存起來,簡單來說就是從根伺服器開始一級一級的問。
我們以前經常談到根伺服器的重要性其實就體現在這裡了,它保留了對所有域名的起始解釋權
上面講到根伺服器擁有一切域名的起始解釋權,但是如果你去問根伺服器它是不會直接告訴你最終答案的。
因為如果它要存儲所有的記錄,那它也太累了,這個負載和開銷是驚人的。
那它會告訴你什麼呢?它會告訴你應該去問誰,也就是它授權下一級伺服器來解答你的問題。
我們來看下面的擬人化過程:
了解了上述過程,我們得到兩個基本結論
有了這兩條結論,剩下的事情就簡單了,我們只需要在最終解釋的查詢結果上做文章就可以了。
簡單來說,就是將你的所有伺服器地址,按照自己需求制定的頻次,返回給用戶。
以http://github.com為例,我們首先獲取它的SOA伺服器(因為dns緩存查詢伺服器會緩存結果,如果你直接去查詢域名,會每次返回一樣的結果),.com的dns域名伺服器也是13台,它們是[a-m].http://gtld-servers.net,我們隨便選一台來找找http://github.com的SOA.如下圖:
OK,我們獲取了四個SOA伺服器 ns[1-4].http://p16.dynect.net,再隨便選一個來問問http://github.com對應的記錄吧,順便試幾次看看最終的ip地址會不會變化
我們這裡查詢了兩次,注意 ANSWER SECTION 部分返回了兩個結果,一次是192.30.252.129,一次是192.30.252.128。
這就是利用dns實現了負載均衡,你的最終訪問會到達不同的ip地址。
有哪些DNS服務商支持負載均衡呢?
這是一種比較高級的服務,一般域名註冊商的dns伺服器不會支持,目前我已知支持它的服務商有:
其中1和4是我們已經在使用的,效果比較理想。
其實DNS可以玩的花樣遠不止這些,還可以做故障轉移,也可以按地區解析等等。
域名從互聯網誕生之初就開始存在了,但是對它的研究以及衍生出來的使用方法才剛剛開始發掘,隨著大家對互聯網利用的提升,這類技術肯定會越來越多。
推薦閱讀: