Dubbo源碼解析之負載均衡策略

簡介

在 Dubbo 中，所有負載均衡實現類均繼承自 AbstractLoadBalance，該類實現了 LoadBalance 介面，並封裝了一些公共的邏輯。所以在分析負載均衡實現之前，先來看一下 AbstractLoadBalance 的邏輯。首先來看一下負載均衡的入口方法 select，如下：

@Override public <T> Invoker<T> select(List<Invoker<T>> invokers, URL url, Invocation invocation) { if (invokers == null || invokers.isEmpty()) return null; // 如果 invokers 列表中僅有一個 Invoker，直接返回即可，無需進行負載均衡 if (invokers.size() == 1) return invokers.get(0);

// 調用 doSelect 方法進行負載均衡，該方法為抽象方法，由子類實現
return doSelect(invokers, url, invocation);
}
?
protected abstract <T> Invoker<T> doSelect(List<Invoker<T>> invokers, URL url, Invocation invocation);

select 方法的邏輯比較簡單，首先會檢測 invokers 集合的合法性，然後再檢測 invokers 集合元素數量。如果只包含一個 Invoker，直接返回該 Inovker 即可。如果包含多個 Invoker，此時需要通過負載均衡演算法選擇一個 Invoker。具體的負載均衡演算法由子類實現，接下來章節會對這些子類一一進行詳細分析。

AbstractLoadBalance 除了實現了 LoadBalance 介面方法，還封裝了一些公共邏輯，比如服務提供者權重計算邏輯。具體實現如下：

protected int getWeight(Invoker<?> invoker, Invocation invocation) { // 從 url 中獲取權重 weight 配置值 int weight = invoker.getUrl().getMethodParameter(invocation.getMethodName(), Constants.WEIGHT_KEY, Constants.DEFAULT_WEIGHT); if (weight > 0) { // 獲取服務提供者啟動時間戳 long timestamp = invoker.getUrl().getParameter(Constants.REMOTE_TIMESTAMP_KEY, 0L); if (timestamp > 0L) { // 計算服務提供者運行時長 int uptime = (int) (System.currentTimeMillis() - timestamp); // 獲取服務預熱時間，默認為10分鐘 int warmup = invoker.getUrl().getParameter(Constants.WARMUP_KEY, Constants.DEFAULT_WARMUP); // 如果服務運行時間小於預熱時間，則重新計算服務權重，即降權 if (uptime > 0 && uptime < warmup) { // 重新計算服務權重 weight = calculateWarmupWeight(uptime, warmup, weight); } } } return weight; } ? static int calculateWarmupWeight(int uptime, int warmup, int weight) { // 計算權重，下面代碼邏輯上形似於 (uptime / warmup) * weight。 // 隨著服務運行時間 uptime 增大，權重計算值 ww 會慢慢接近配置值 weight int ww = (int) ((float) uptime / ((float) warmup / (float) weight)); return ww < 1 ? 1 : (ww > weight ? weight : ww); }

上面是權重的計算過程，該過程主要用於保證當服務運行時長小於服務預熱時間時，對服務進行降權，避免讓服務在啟動之初就處於高負載狀態。服務預熱是一個優化手段，與此類似的還有 JVM 預熱。主要目的是讓服務啟動後「低功率」運行一段時間，使其效率慢慢提升至最佳狀態。

關於 AbstractLoadBalance 就先分析到這，接下來分析各個實現類的代碼。首先，我們從 Dubbo 預設的實現類 RandomLoadBalance 看起。

1. RandomLoadBalance

RandomLoadBalance 是加權隨機演算法的具體實現，它的演算法思想很簡單。假設我們有一組伺服器 servers = [A, B, C]，他們對應的權重為 weights = [5, 3, 2]，權重總和為10。現在把這些權重值平鋪在一維坐標值上，[0, 5) 區間屬於伺服器 A，[5, 8) 區間屬於伺服器 B，[8, 10) 區間屬於伺服器 C。接下來通過隨機數生成器生成一個範圍在 [0, 10) 之間的隨機數，然後計算這個隨機數會落到哪個區間上。比如數字3會落到伺服器 A 對應的區間上，此時返回伺服器 A 即可。權重越大的機器，在坐標軸上對應的區間範圍就越大，因此隨機數生成器生成的數字就會有更大的概率落到此區間內。只要隨機數生成器產生的隨機數分布性很好，在經過多次選擇後，每個伺服器被選中的次數比例接近其權重比例。比如，經過一萬次選擇後，伺服器 A 被選中的次數大約為5000次，伺服器 B 被選中的次數約為3000次，伺服器 C 被選中的次數約為2000次。

以上就是 RandomLoadBalance 背後的演算法思想，比較簡單。下面開始分析源碼。

public class RandomLoadBalance extends AbstractLoadBalance { ? public static final String NAME = "random"; ? private final Random random = new Random(); ? @Override protected <T> Invoker<T> doSelect(List<Invoker<T>> invokers, URL url, Invocation invocation) { int length = invokers.size(); int totalWeight = 0; boolean sameWeight = true; // 下面這個循環有兩個作用，第一是計算總權重 totalWeight， // 第二是檢測每個服務提供者的權重是否相同 for (int i = 0; i < length; i++) { int weight = getWeight(invokers.get(i), invocation); // 累加權重 totalWeight += weight; // 檢測當前服務提供者的權重與上一個服務提供者的權重是否相同， // 不相同的話，則將 sameWeight 置為 false。 if (sameWeight && i > 0 && weight != getWeight(invokers.get(i - 1), invocation)) { sameWeight = false; } }

// 下面的 if 分支主要用於獲取隨機數，並計算隨機數落在哪個區間上
if (totalWeight > 0 && !sameWeight) {
// 隨機獲取一個 [0, totalWeight) 區間內的數字
int offset = random.nextInt(totalWeight);
// 循環讓 offset 數減去服務提供者權重值，當 offset 小於0時，返回相應的 Invoker。
// 舉例說明一下，我們有 servers = [A, B, C]，weights = [5, 3, 2]，offset = 7。
// 第一次循環，offset - 5 = 2 > 0，即 offset > 5，
// 表明其不會落在伺服器 A 對應的區間上。
// 第二次循環，offset - 3 = -1 < 0，即 5 < offset < 8，
// 表明其會落在伺服器 B 對應的區間上
for (int i = 0; i < length; i++) {
// 讓隨機值 offset 減去權重值
offset -= getWeight(invokers.get(i), invocation);
if (offset < 0) {
// 返回相應的 Invoker
return invokers.get(i);
}
}
}

// 如果所有服務提供者權重值相同，此時直接隨機返回一個即可
return invokers.get(random.nextInt(length));
}
}

RandomLoadBalance 的演算法思想比較簡單，在經過多次請求後，能夠將調用請求按照權重值進行「均勻」分配。當然 RandomLoadBalance 也存在一定的缺點，當調用次數比較少時，Random 產生的隨機數可能會比較集中，此時多數請求會落到同一台伺服器上。這個缺點並不是很嚴重，多數情況下可以忽略。RandomLoadBalance 是一個簡單，高效的負載均衡實現，因此 Dubbo 選擇它作為預設實現。

關於 RandomLoadBalance 就先到這了，接下來分析 LeastActiveLoadBalance。

2. LeastActiveLoadBalance

LeastActiveLoadBalance 翻譯過來是最小活躍數負載均衡。活躍調用數越小，表明該服務提供者效率越高，單位時間內可處理更多的請求。此時應優先將請求分配給該服務提供者。在具體實現中，每個服務提供者對應一個活躍數 active。初始情況下，所有服務提供者活躍數均為0。每收到一個請求，活躍數加1，完成請求後則將活躍數減1。在服務運行一段時間後，性能好的服務提供者處理請求的速度更快，因此活躍數下降的也越快，此時這樣的服務提供者能夠優先獲取到新的服務請求、這就是最小活躍數負載均衡演算法的基本思想。除了最小活躍數，LeastActiveLoadBalance 在實現上還引入了權重值。所以準確的來說，LeastActiveLoadBalance 是基於加權最小活躍數演算法實現的。舉個例子說明一下，在一個服務提供者集群中，有兩個性能優異的服務提供者。某一時刻它們的活躍數相同，此時 Dubbo 會根據它們的權重去分配請求，權重越大，獲取到新請求的概率就越大。如果兩個服務提供者權重相同，此時隨機選擇一個即可。關於 LeastActiveLoadBalance 的背景知識就先介紹到這裡，下面開始分析源碼。

public class LeastActiveLoadBalance extends AbstractLoadBalance { ? public static final String NAME = "leastactive"; ? private final Random random = new Random(); ? @Override protected <T> Invoker<T> doSelect(List<Invoker<T>> invokers, URL url, Invocation invocation) { int length = invokers.size(); // 最小的活躍數 int leastActive = -1; // 具有相同「最小活躍數」的服務者提供者（以下用 Invoker 代稱）數量 int leastCount = 0; // leastIndexs 用於記錄具有相同「最小活躍數」的 Invoker 在 invokers 列表中的下標信息 int[] leastIndexs = new int[length]; int totalWeight = 0; // 第一個最小活躍數的 Invoker 權重值，用於與其他具有相同最小活躍數的 Invoker 的權重進行對比， // 以檢測是否「所有具有相同最小活躍數的 Invoker 的權重」均相等 int firstWeight = 0; boolean sameWeight = true; ? // 遍歷 invokers 列表 for (int i = 0; i < length; i++) { Invoker<T> invoker = invokers.get(i); // 獲取 Invoker 對應的活躍數 int active = RpcStatus.getStatus(invoker.getUrl(), invocation.getMethodName()).getActive(); // 獲取權重 - ?? int weight = invoker.getUrl().getMethodParameter(invocation.getMethodName(), Constants.WEIGHT_KEY, Constants.DEFAULT_WEIGHT); // 發現更小的活躍數，重新開始 if (leastActive == -1 || active < leastActive) { // 使用當前活躍數 active 更新最小活躍數 leastActive leastActive = active; // 更新 leastCount 為 1 leastCount = 1; // 記錄當前下標值到 leastIndexs 中 leastIndexs[0] = i; totalWeight = weight; firstWeight = weight; sameWeight = true; ? // 當前 Invoker 的活躍數 active 與最小活躍數 leastActive 相同 } else if (active == leastActive) { // 在 leastIndexs 中記錄下當前 Invoker 在 invokers 集合中的下標 leastIndexs[leastCount++] = i; // 累加權重 totalWeight += weight; // 檢測當前 Invoker 的權重與 firstWeight 是否相等， // 不相等則將 sameWeight 置為 false if (sameWeight && i > 0 && weight != firstWeight) { sameWeight = false; } } }

// 當只有一個 Invoker 具有最小活躍數，此時直接返回該 Invoker 即可
if (leastCount == 1) {
return invokers.get(leastIndexs[0]);
}
?
// 有多個 Invoker 具有相同的最小活躍數，但它們之間的權重不同
if (!sameWeight && totalWeight > 0) {
// 隨機生成一個 [0, totalWeight) 之間的數字
int offsetWeight = random.nextInt(totalWeight);
// 循環讓隨機數減去具有最小活躍數的 Invoker 的權重值，
// 當 offset 小於等於0時，返回相應的 Invoker
for (int i = 0; i < leastCount; i++) {
int leastIndex = leastIndexs[i];
// 獲取權重值，並讓隨機數減去權重值 - ??
offsetWeight -= getWeight(invokers.get(leastIndex), invocation);
if (offsetWeight <= 0)
return invokers.get(leastIndex);
}
}
// 如果權重相同或權重為0時，隨機返回一個 Invoker
return invokers.get(leastIndexs[random.nextInt(leastCount)]);
}
}

上面代碼的邏輯比較多，我們在代碼中寫了大量的注釋，有幫助大家理解代碼邏輯。下面簡單總結一下以上代碼所做的事情，如下：

遍歷 invokers 列表，尋找活躍數最小的 Invoker
如果有多個 Invoker 具有相同的最小活躍數，此時記錄下這些 Invoker 在 invokers 集合中的下標，並累加它們的權重，比較它們的權重值是否相等
如果只有一個 Invoker 具有最小的活躍數，此時直接返回該 Invoker 即可
如果有多個 Invoker 具有最小活躍數，且它們的權重不相等，此時處理方式和 RandomLoadBalance 一致
如果有多個 Invoker 具有最小活躍數，但它們的權重相等，此時隨機返回一個即可

以上就是 LeastActiveLoadBalance 大致的實現邏輯，大家在閱讀的源碼的過程中要注意區分活躍數與權重這兩個概念，不要混為一談。

以上分析是基於 Dubbo 2.6.4 版本進行的，由於近期 Dubbo 2.6.5 發布了，並對 LeastActiveLoadBalance 進行了一些修改，下面簡單來介紹一下修改內容。回到上面的源碼中，我們在上面的代碼中標註了兩個黃色的五角星??。兩處標記對應的代碼分別如下：

int weight = invoker.getUrl().getMethodParameter(invocation.getMethodName(), Constants.WEIGHT_KEY, Constants.DEFAULT_WEIGHT); offsetWeight -= getWeight(invokers.get(leastIndex), invocation);

問題出在服務預熱階段，第一行代碼直接從 url 中取權重值，未被降權過。第二行代碼獲取到的是經過降權後的權重。第一行代碼獲取到的權重值最終會被累加到權重總和 totalWeight 中，這個時候會導致一個問題。offsetWeight 是一個在 [0, totalWeight) 範圍內的隨機數，而它所減去的是經過降權的權重。很有可能在經過 leastCount 次運算後，offsetWeight 仍然是大於0的，導致無法選中 Invoker。這個問題對應的 issue 為 #904，並在 pull request #2172 中被修復。具體的修復邏輯是將標註一處的代碼修改為：

// afterWarmup 等價於上面的 weight 變數，這樣命名是為了強調該變數經過了 warmup 降權處理 int afterWarmup = getWeight(invoker, invocation);

另外，2.6.4 版本中的 LeastActiveLoadBalance 還要一個缺陷，即當一組 Invoker 具有相同的最小活躍數，且其中一個 Invoker 的權重值為1，此時這個 Invoker 無法被選中。缺陷代碼如下：

int offsetWeight = random.nextInt(totalWeight); for (int i = 0; i < leastCount; i++) { int leastIndex = leastIndexs[i]; offsetWeight -= getWeight(invokers.get(leastIndex), invocation); if (offsetWeight <= 0) // ? return invokers.get(leastIndex); }

問題出在了offsetWeight <= 0上，舉例說明，假設有一組 Invoker 的權重為 5、2、1，offsetWeight 最大值為 7。假設 offsetWeight = 7，你會發現，當 for 循環進行第二次遍歷後 offsetWeight = 7 - 5 - 2 = 0，提前返回了。此時，此時權重為1的 Invoker 就沒有機會被選中了。該問題在 Dubbo 2.6.5 中被修復了，修改後的代碼如下：

int offsetWeight = random.nextInt(totalWeight) + 1;

以上就是 Dubob 2.6.5 對 LeastActiveLoadBalance 的更新，內容不是很多，先分析到這。接下來分析基於一致性 hash 思想的 ConsistentHashLoadBalance。

3. ConsistentHashLoadBalance

一致性 hash 演算法由麻省理工學院的 Karger 及其合作者於1997年提出的，演算法提出之初是用於大規模緩存系統的負載均衡。它的工作過程是這樣的，首先根據 ip 或者其他的信息為緩存節點生成一個 hash，並將這個 hash 投射到 [0, 232 - 1] 的圓環上。當有查詢或寫入請求時，則為緩存項的 key 生成一個 hash 值。然後查找第一個大於或等於該 hash 值的緩存節點，併到這個節點中查詢或寫入緩存項。如果當前節點掛了，則在下一次查詢或寫入緩存時，為緩存項查找另一個大於其 hash 值的緩存節點即可。大致效果如下圖所示，每個緩存節點在圓環上佔據一個位置。如果緩存項的 key 的 hash 值小於緩存節點 hash 值，則到該緩存節點中存儲或讀取緩存項。比如下面綠色點對應的緩存項將會被存儲到 cache-2 節點中。由於 cache-3 掛了，原本應該存到該節點中的緩存項最終會存儲到 cache-4 節點中。

Dubbo源碼解析之負載均衡策略