假如你開發了一個網站(例如網上商店、社交網站或者其他任何東西),之後你把它發布到了網上,網站運行良好,每天有幾百的訪問量,能快速地響應用戶的請求。

如何從單個服務器擴展到百萬用戶的系統? 科技 第1張

但是有一天,不知道什麼原因,你的網站出名了! 每分每秒都有成千上萬的用戶蜂擁而至,你的網站變得越來越慢……

對你來講,這是個好消息,但是對你的 Web 應用來說這是個壞消息。因為現在它需要擴展了,你的應用需要為全球用戶提供 7*24 不宕機服務。

如何進行擴展?

幾年前,我討論過水平擴展與垂直擴展。簡而言之, 垂直擴展意味着在性能更強的計算機上運行同樣的服務,而水平擴展是並行地運行多個服務。

如今,幾乎沒有人說垂直擴展了。原因很簡單:

隨着計算機性能的增長,其價格會成倍增長。

單臺計算機的性能是有上限的,不可能無限制地垂直擴展。

多核 CPU 意味着即使是單臺計算機也可以並行的。那麼,為什麼不一開始就並行化呢?

現在我們水平擴展服務。需要哪些步驟呢?

單臺服務器+數據庫

如何從單個服務器擴展到百萬用戶的系統? 科技 第2張

上圖可能是你後端服務最初的樣子。有一個執行業務邏輯的應用服務器(Application Server)和保存數據的數據庫。

看上去很不錯。但是這樣的配置,滿足更高要求的唯一方法是在性能更強的計算機上運行,這點不是很好。

增加一個反向代理

如何從單個服務器擴展到百萬用戶的系統? 科技 第3張

成為大規模服務架構的第一步是添加反向代理。類似於酒店大堂的接待處。

你也可以讓客人直接去他們的客房。但是實際上,你需要一個中間人他去檢查是否允許客人進入, 如果客房沒有開放,得有人告訴客人,而不是讓客人處於尷尬的境地。這些事情正是反向代理需要做的。

通常,代理是一個接收和轉發請求的過程。正常情況下,「正向代理」代理的對象是客戶端,「反向代理」代理的對象是服務端,它完成這些功能:

健康檢查功能,確保我們的服務器是一直處於運行狀態的。

路由轉發功能,把請求轉發到正確的服務路徑上。

認證功能,確保用戶有權限訪問後端服務器。

防火牆功能,確保用戶只能訪問允許使用的網絡部分等等。

引入負載均衡器

如何從單個服務器擴展到百萬用戶的系統? 科技 第4張

大多數反向代理還有另外一個功能:他們也可以充當負載均衡器。

負載均衡器是個簡單概念,想象下有一百個用戶在一分鐘之內在你的網店裡付款。

遺憾的是,你的付款服務器在一分鐘內只能處理 50 筆付款。這怎麼辦呢?同時運行兩個付款服務器就行了。

負載均衡器的功能就是把付款請求分發到兩臺付款服務器上。用戶 1 往左,用戶 2 往右,用戶 3 再往左。。。以此類推。

如果一次有 500 個用戶需要立刻付款,這該怎麼解決呢?確切地說,你可以擴展到十臺付款服務器,之後讓負載均衡器分發請求到這十臺服務器上。

擴展數據庫

如何從單個服務器擴展到百萬用戶的系統? 科技 第5張

負載均衡器的使用使得我們可以在多個服務器之間分配負載。但是你發現問題了嗎?

盡管我們可以用成百上千臺服務器處理請求,但是他們都是用同一個數據庫存儲和檢索數據。

那麼,我們不能以同樣的方式來擴展數據庫嗎?很遺憾,這裏有個一致性的問題。

系統使用的所有服務需要就他們使用的數據達成一致。數據不一致會導致各種問題,如訂單被多次處理,從一個餘額只有 100 元的賬戶中扣除兩筆 90 元的付款等等......那麼我們在擴展數據庫的時候如何確保一致性呢?

我們需要做的第一件事是把數據庫分成多個部分。一部分專門負責接收並存儲數據,其他部分負責檢索數據。

這個方案有時稱為主從模式或者單實例寫多副本讀。這裏假設是從數據庫讀的頻率高於寫的頻率。

這個方案的好處是保證了一致性,因為數據只能被單實例寫入,之後把寫入數據同步到其他部分即可。缺點是我們仍然只有一個寫數據庫實例。

這對於中小型的 Web 應用來說沒問題, 但是像 Facebook 這樣的則不會這樣做了。

微服務

如何從單個服務器擴展到百萬用戶的系統? 科技 第6張

到目前為止,我們的付款、訂單、庫存、用戶管理等等這些功能都在一臺服務器上。

這也不是壞事,單個服務器同時意味着更低的復雜性。隨着規模的增加,事情會變得復雜和低效:

開發團隊隨着應用的發展而增長。但是隨着越來越多的開發人員工作在同一臺服務器上,發生沖突的可能性很大。

僅有一臺服務器,意味着每當我們發布新版本時,必須要等所有工作完成後才能發布。

當一個團隊想快速地發布而另外一個團隊只完成了一半工作的時候,這種互相依賴性很危險。

對於這些問題的解決方案是一個新的架構範式,微服務。它已經在開發人員中掀起了風暴:

每個服務都可以單獨擴展,更好地適應需求。

開發團隊之間相互獨立,每個團隊都負責自己的微服務生命週期(創建,部署,更新等)。

每個微服務都有自己的資源,比如數據庫,進一步緩解了第 4 節中的問題。

緩存和內容分發網絡(CDN)

如何從單個服務器擴展到百萬用戶的系統? 科技 第7張

有什麼方式能使服務更高效? 網絡應用的很大一部由靜態資源構成,如圖片、CSS 樣式文件、JavaScript 腳本以及一些針對特定產品提前渲染好的頁面等等。

我們使用緩存而不是對每個請求都重新處理,緩存用於記住最後一次的結果並交由其他服務或者客戶端,這樣就不用每次都請求後端服務了。

緩存的加強版叫內容分發網絡(Content Delivery Network),遍佈全球的大量緩存。

這使得用戶可以從物理上靠近他們的地方來獲取網頁內容,而不是每次都把數據從源頭搬到用戶那裡。

消息隊列

如何從單個服務器擴展到百萬用戶的系統? 科技 第8張

你去過遊樂園嗎?你是否走到售票櫃臺去買票?也許不是這樣,可能是排隊等候。

政府機構、郵局、遊樂園入口都屬於並行概念的例子,多個售票亭同時售票,但似乎也永遠不足以為每個人立即服務,於是隊列形成了。

隊列同樣也是用於大型 Web 應用。每分鐘都有成千上萬的圖片上傳到 Instagram、Facebook 每個圖片都需要處理,調整大小,分析與打標簽,這些都是耗時的處理過程。

因此,不要讓用戶等到完成所有步驟,圖片接收服務只需要做以下三件事:

存儲原始的、未處理的圖片。

向用戶確認圖片已經上傳。

創建一個待辦的任務。

這個待辦事項列表中的任務可以被其他任意數量服務接收,每個服務完成其中一個任務,直到所有的待辦事項完成。管理這些“待辦事項列表”的稱為消息隊列。

使用這樣的隊列有許多優點:

解耦了任務和處理過程。有時需要處理大量的圖片,有時很少。有時有大量服務可用,有時很少可用。簡單地把任務添加到待辦事項而不是直接處理它們,這確保了系統保持響應並且任務也不會丟失。

可以按需擴展。啟動大量的服務比較耗時,所以當有大量用戶上傳圖片時再去啟動服務,這已經太晚了。我們把任務添加到隊列中,我們可以推遲提供額外的處理能力。

好了,如果按照我們上面的所有步驟操作下來,我們的系統已經做好提供大流量服務的準備了。

但是如果還想提供更大量的,該怎麼做呢?還有一些可以做。

分片,分片,還是分片

如何從單個服務器擴展到百萬用戶的系統? 科技 第9張

什麼是分片?好吧,深呼吸一下,準備好了嗎?我們看下定義:

"Sharding is a technique of parallelizing an application's stacks by separating them into multiple units, each responsible for a certain key or namespace"

哎呦...... 分片究竟是什麼意思呢?其實也很簡單:Facebook 上需要為 20 億用戶提供個人資料, 可以把你的應用架構分解為 26 個 mini-Facebook。

用戶名如果以 A 開頭,會被 mini-facebook A 處理, 用戶名如果以 B 開頭,會被 mini-facebook B 來處理……

分片不一定按字母順序,根據業務需要,你可以基於任何數量的因素,比如位置、使用頻率(特權用戶被路由到好的硬件)等等。你可以根據需要以這種方式切分服務器、數據庫或其他方面。

對負載均衡器進行負載均衡

如何從單個服務器擴展到百萬用戶的系統? 科技 第10張

到目前為止,我們一直使用一個負載均衡器,即使你購買的一些功能強悍(且其價格極其昂貴)的硬件負載均衡器,但是他們可以處理的請求量也存在硬件限制。

幸運地是,我們可以有一個全球性、分散且穩定的層,用於在請求達到負載均衡器之前對請求負載均衡。

最棒的地方是免費,這是域名系統或簡稱DNS。DNS 將域名(如 arcentry.com)映射到 IP,143.204.47.77。DNS 允許我們為域名指定多個 IP,每個 IP 都會解析到不同的負載均衡器。

你看,擴展 Web 應用確實需要考慮很多東西,感謝你和我們一起待了這麼久。

我希望這篇文章能給你一些有用的東西。但是如果你做任何 IT 領域相關的工作,你在閱讀本文的時候,可能有個問題一直縈繞在你的腦海:"雲服務是怎樣的呢?"

Cloud Computing / Serverless

但是雲服務如何呢?確實,它是上面許多問題最有效的解決方案。

你無需解決這些難題。相反,這些難題留給了雲廠商,他們為我們提供一個系統,可以根據需求進行擴展,而不用擔心錯綜復雜的問題。

例如,Arcentry 網站不會執行上述討論的任何操作(除了數據庫的讀寫分離),而只是把這些難題留給 Amazon Web Service Lambda 函數處理了,用戶省去了煩惱。

但是,並不是說你使用了雲服務以後(如 Amazon Web Service Lambda)所有的問題都解決了,它隨之而來的是一系列挑戰和權衡。

作者:Wolfram Hempel ,Join 翻譯

來源:碼農翻身

相關文章