2.0 解析系列終篇 | OceanBase 2.0 到底如何做到 50% 的性能提升？

OB君：本文是「OceanBase 2.0 技術解析系列」的終篇。在前面的系列文章中，我們從可運維性、分散式架構、數據可用性及兼容性四個方面對OceanBase 2.0的產品新特性及其背後的技術原理進行了系統性的深入解析。
今天的終篇我們來聊聊最重要的OceanBase 2.0在性能優化方面所展開的工作，以及OceanBase是如何實現極致性能的。本文整理自10月27日OceanBase TechTalk北京站活動中顏然的演講《OceanBase 2.0的性能突破》。Tips：你可以關注"OceanBase"公眾號，回復「1027」一鍵下載PPT

今天的內容主要分為以下幾個部分：首先為大家簡單介紹一下OceanBase的架構和存儲引擎，以及OceanBase的優化目標和圍繞目標所展開的工作，最後還將分享一下我們未來在性能優化方面的規劃。

OceanBase介紹

OceanBase是完全自主研發的金融級分散式關係資料庫，從架構上可以通過擴展機器來解決集羣服務能力的擴展需求。

OceanBase採用多副本複製的方案解決了可靠性和可用性的需求，而且構建在普通PC伺服器上，不依賴於高端引擎。

我們的目標是在普通硬體上提供極限性能的資料庫服務。那麼，OceanBase的存儲引擎有什麼特點呢？

OceanBase的存儲引擎類似於LSM Tree，所有新增的修改都會先記錄在Memtable中，這些數據的變更並不會實時寫到磁碟上，而會在後臺定期寫到硬碟上。

不管是磁碟還是SSD，當有大量寫入的時候，它的讀取性能都會受到很大影響。從一開始OceanBase的架構就是為了適應這種硬體的特性，所以沒有隨機寫的操作，對於SSD和磁碟都很友好，可以將硬碟的吞吐量優勢發揮出來，把硬體資源最好的性能壓榨出來。

OceanBase從0.x版本到1.x版本，再到現在的2.0版本，一直在推動的一件事就是把硬體的性能做到極致，希望在同樣的硬體條件下能給業務帶來更多性能的空間。OceanBase的目標一直是有極致性能並且性價比最好的資料庫。

OceanBase的性能目標

從用戶使用角度來看，資料庫有兩個重要的指標，延遲（Latency）和吞吐量（Throughput）。這是兩個非常不一樣的指標。

根據排隊論模型，這兩者之間的關係如圖中所示：隨著吞吐量增加，延遲近似指數倍增長。

當整體系統的性能不是特別高的時候，可以保持延遲的穩定性。當系統性能壓力很高的情況下，延遲會增加，我們要做的事情就是要在一個合理的延遲情況下，讓吞吐量可以儘可能大。換句話說，其實就是把一個請求要做的事情儘可能的減少，然後讓單位時間內能做的請求儘可能的多。性能優化的最終目標就是在延遲可以接受的場景下，儘可能提高系統的吞吐量。

性能優化工作

在剛剛過去的2018年天貓雙11中，成交額2135億再次創造了新紀錄。那麼在螞蟻金服/支付寶這樣的場景下，支付的壓力會全部落在OceanBase 2.0版本上。在2.0版本里我們做了一個很重要的事情來進一步壓榨硬體的性能——也就是在去年同樣機器數量的情況下，來支撐今年的流量洪峯。

在同樣的硬體環境，同樣的機器規模數這些條件下，通過升級的伺服器版本以及伺服器的部署方式，來提供今年雙11在0:00:00洪峯到來時的抗壓能力。雙11的支付壓力是典型的OLTP模型，有大量的增刪改查操作。OceanBase的存儲模型決定了操作主要在內存中進行，所以在滿負荷運轉下CPU是主要瓶頸。

CPU的資源如何壓榨到極致，其實主要包含兩方面的工作：

一是優化語句執行消耗指令數（Instructions / SQL），即每個請求需要執行的指令數，指令越少越好；
二是優化系統執行指令的效率（Cycles / Instruction），可以用CPI（Cycles per Instruction）表示。

系統性能由每一行代碼決定

任何一段代碼都可能導致bug，任何一行代碼也都有性能優化的空間。針對不同的場景，我們需要深入到每行代碼裏去看可以做什麼樣的優化。

OceanBase 2.0版本進行了深度的優化獲得了很好的性能提升。上圖所列的只是其中一部分優化工作。性能優化是一個事無巨細的工作，有點類似於測試工作，本質上每一行代碼都會影響系統的性能。

優化CPU開銷

Commit非同步化

在OceanBase已有的模型裏，網路模塊有單獨的線程池負責和客戶端通信，接受用戶請求和返回請求結果。接收到的請求會發在任務隊列中由工作線程處理。

相比較於每一個用戶的連接使用一個獨立的線程服務的模型，OceanBase的模型可以大大減少上下文切換的次數。

對於SQL語句的執行，這已經是一個很好的模型了。但是對於事務的提交操作，需要將日誌在本地持久化和發送到其他副本持久化，提交操作又會使得工作線程出現等待的情況。

Commit非同步化是在事務提交日誌後不再等待日誌持久化，工作線程可以直接去隊列中取下一個任務執行。等日誌持久化完成後，通過回調的方式出發事務提交完成的操作和給用戶發送請求的結果。

優化系統擴展性

擴展性問題

我們做了很多事情讓系統少做無謂的事情，多做有用的事情，也就是增加CPU做有效工作的時間佔比。

機器的CPU核數越來越多，從原來的幾十個核和現在的一百多個核，在英特爾的PC Server上都是很常見的場景。系統在伺服器上運行，多核CPU的擴展性是一個很重要的方面。這裡以計數器場景舉例，單個線程和多個線程一起操作同一個計數器，後者因為多個核之間競爭同一個內存單元，性能會下降幾百倍。其實有時候人多不一定力量大，人多也有可能導致大家一起搶賽道。

在系統中也大量存在類似的競爭場景，內存分配器是一個常見場景。多個線程在操作同一個memtable時，會從連續的內存塊中分配內存，分配內存的操作就好似計數器的競爭。所以，要把memtable的內存分配操作做成分區的形式，減少多個核之間的競爭。

說到底性能優化其實就是在優化系統的各個細節，每個細節都要做到極致，最終性能才能壓榨到最好的那個點，才能把硬體本身的性能發揮到最好。

性能無止盡

我們可以看到，藍色塊代表的是OceanBase 1.4版本，也就是我們現在使用的主力版本，綠色塊代表了OceanBase 2.0版本。A場景是下單場景，也就是點提交訂單時的操作，B場景是支付場景，就是登到支付寶裏去最終付款的場景。

最後結果是：在下單場景下，OceanBase 2.0版本比1.4版本的性能提升了63%，在支付場景下，提升了58%。

未來工作

未來OceanBase會加強面向全棧的優化，同時會對工作負載進行優化，也會有面向新硬體方面的優化工作。

OceanBase會持續進行性能優化的工作，目的是持續為用戶提供具有最高極限性能以及最好性價比的產品。這是OceanBase所一直秉承的理念。

OceanBase技術交流羣

— 想了解更多OceanBase 2.0新特性？

— 想與螞蟻金服OceanBase的一線技術專家深入交流？

掃描下方二維碼聯繫小編，快速加入OceanBase技術交流羣！

2.0解析系列文章

一文詳解新一代OceanBase雲平臺（1）
如絲般順滑！一線運維人員談如何實現資料庫的平滑在線升級（2）
OceanBase的重要基礎設施 —— DBReplay（3）
OceanBase負載均衡的魅力（4）
如何在分散式架構下完美實現「全局數據一致性」？（5）
OceanBase 2.0 之 Flashback 閃回功能（6）
OceanBase 2.0 之索引實時生效（7）
OceanBase 2.0——第一款支持「存儲過程」的原生分散式資料庫（8）
一文詳解 OceanBase 2.0 的「全局索引」功能（9）
OceanBase 2.0 的 Oracle 兼容模式（10）
OceanBase 2.0的高級數據壓縮特性（11）

2.0 解析系列終篇 | OceanBase 2.0 到底如何做到 50% 的性能提升？

OceanBase介紹

OceanBase的性能目標

優化CPU開銷

優化系統擴展性

性能無止盡

未來工作

OceanBase技術交流羣

2.0解析系列文章

熱門新聞

週熱門

2.0 解析系列終篇 | OceanBase 2.0 到底如何做到 50% 的性能提升？

OceanBase介紹

OceanBase的性能目標

優化CPU開銷

優化系統擴展性

性能無止盡

未來工作

OceanBase技術交流羣

2.0解析系列文章

如何看待螞蟻金服OceanBase拿下世界第一，性能超老牌資料庫Oracle 100％?

如何看待螞蟻金服國產分散式資料庫 OceanBase 在 TPC-C 測試超 Oracle 榮獲第一？

2.0解析系列 | 一文詳解 OceanBase 2.0 的「全局索引」功能

OceanBase的重要基礎設施——DBReplay

最佳實踐 | OceanBase事務引擎的技術創新

2.0解析系列 | OceanBase 2.0 之 Flashback 閃回功能

【乾貨集錦】OceanBase 2.0 技術解析系列—核心技術原理深入解讀

阿里技術分享：阿里自研金融級資料庫OceanBase的艱辛成長之路

陽振坤：OceanBase如何跨越關係資料庫的「死亡之谷」

螞蟻雙11的這羣築夢師

2.0 解析系列 | 如何在分散式架構下完美實現「全局數據一致性」？

2.0 解析系列 | 如絲般順滑！一線運維人員談如何實現資料庫的平滑在線升級

2.0解析系列 | OceanBase 2.0——第一款支持「存儲過程」的原生分散式資料庫

世界領先！一文詳解OceanBase的高可用及容災方案

如何避免 GitHub 那樣斷網 43 秒癱瘓 24 個小時？

熱門新聞

週熱門