謝邀。

首先明確一下到底怎麼回事,按吞吐倒序取前兩個,再加上成本和伺服器配置的結果如圖:(鏈接在此)

媒體有幾個點沒有提到:

  • oracle 的這個結果是 9 年前的。9 年來硬體雖然不能說有突飛猛進的發展,但明顯還是有差距的(最後兩列)
  • 在吞吐翻倍之餘,總價(total price)只貴了 70%多,從而單位吞吐的價格(price/tpmc) 低了 13%。
  • 下面有個答主說 cluster 的問題,這邊都是Y。oracle 也是 rac 集群。

總得來說光從這個數據可以認為 ob 單機性能有一定提升(沒有遠超這麼誇張),拓展性更好,在相近的單位成本下能夠通過水平擴容達到更高的吞吐。

如果在這個事件的推動下 oracle,aurora,spanner 都去更新一波評測結果,那就更有說服力了。不管怎麼樣國內基礎設施領域終於有了能與國際頂尖產品同台競技的實力,值得慶賀。


在分享我的看法之前,還是先恭喜陽振坤老師,之前看過他的關於OB10年歷程的採訪視頻,確實是件不容易的事情。

阿里雲近期開放了國內首個資料庫標準化測試平台,直接在雲上提供經過TPC-C技術委員會認證的、與OceanBase打榜時完全一致的雲資源環境。這一舉動當然是對前段時間伴隨OceanBase在TPC-C中登頂而來的一些質疑的最好回應,而我個人更看重這一舉措、在推動資料庫邁向「雲上」新時代的重要意義。

資料庫作為IT產業體系中最為基礎也是最為硬核的領域之一,已經經歷了從以Oracle為代表的傳統商業資料庫,到以MySQL為代表的商業資料庫,再到方興未艾的以亞馬遜AWS Aurora,阿里雲的POLARDB為代表的 「雲原生」資料庫的三次演變。「資料庫的未來在雲上」已是行業共識。而這次,從TPC-C委員會對於雲測試平台的認可,到OceanBase靠雲登頂,都證明了資料庫的「上雲」,確實是可靠、可信的趨勢。而阿里雲開放的測試平台,把「資料庫上雲」這個可信、可靠的趨勢,往「可行」的方向,切實地又往前推進了一步。

「可行」的一方面,在於新舊技術碰撞銜接時,對於遷移成本、測試成本、維護成本的優化。如今大量金融、保險等企業級的應用,依然跑在傳統的本地商業資料庫上。而對於這些應用的「上雲」過程,本地資料庫 「上雲」的過程是否順暢安全,雲上資料庫災容吞吐等性能如何被高效地測試與保障,都是必須解答的問題。否則,就會像19世紀末的倫敦街頭,代表著新技術,但樣式難看、冒著黑煙、時速不足兩英里每小時的汽車,依舊只能憋屈地給優雅輕便的馬車讓路。如果說阿里雲POLARDB 5月發布的」傳統資料庫一鍵遷移功能」解決了「遷移成本」的問題,那這次的標準化測試平台,則是撕開了「雲上性能高效測試」這個問題的一道口子。他帶來的更加高效、透明的測試方式,無疑會加速傳統資料庫應用客戶對於新興的「雲原生」時代的接受和擁抱。

「可行」的另一方面,在於門檻降低、參與者增加,場景需求變豐富、「上雲」者眾後,將倒逼「雲上」資料庫技術和生態本身的演進,從而衍生出未來更多的可能性。阿里達摩院資料庫首席科學家李飛飛曾斷言:「(資料庫領域)任何技術都是業務推動來衍生的,只要你有業務場景,我覺得你的技術一定會逐步發展到領先。」拋去阿里自身豐富的業務場景不談,被開放測試平台所降低的門檻,將吸引更多的開發團隊,參與多元場景用途資料庫的開發測試,而作為需要承接這些「多元」的雲,本身對「多元」的承載力也必須進化。特別是在新興的「NoSQL」—— 非結構化及專有領域,對高性能分散式的圖資料庫(GraphDB)、文檔型資料庫(MongoDB)的支持與提升。

希望在不久的未來,原本僅是大廠才能布局的、「陽春一曲和皆難」的商業資料庫的開發測試部署,能變成「雲原生」資料庫時代「萬類霜天競自由」的生態,從而助力整個IT產業的多元發展。


我認為,阿里雲推出的雲上資料庫新評測體系對於整個資料庫行業是非常友好的,要知道,TPC測試的成本是相當高的。

很多觀點認為,金融類IT系統出於對極致安全性和穩定性的追求,是不會考慮遷移到雲上的。OceanBase作為一個金融級資料庫,使用阿里雲伺服器降低TPC評測成本,意味著數據的上雲之路來到了一個新的里程碑。

阿里雲此次推出的評測方案,也標誌著資料庫上雲的一個新的里程碑。雲計算髮展的過程中,雲計算的邊界在哪裡、什麼該上雲什麼不該上雲,一直是業界討論的熱點話題。在阿里雲喊出「All In Cloud」的口號之後,有一種聲音認為,金融領域對穩定性、安全性要求嚴格,是不適合上雲的。而Oceanbase作為一種雲上的金融級資料庫,還獲得了評測機構和客戶的認可,這說明阿里雲基礎設施的穩定性和安全性,已經滿足金融級軟體系統的需求。

因為工作原因,我也了解過一些TPC測試標準。TPC本身有多個不同的測試標準,比如TPC-DS、TPC-C、TPC-H等,面向的場景各有不同。這次OceanBase是參與的TPC-C評測。我自己的工作主要是面向分析型場景,所以對TPC-H更了解一些。資料庫是一個生態很複雜的行業,除了大家最熟悉的MySQL、Postgres等資料庫,有很多不同的資料庫產品,性能特徵、功能豐富程度、硬體需求都各不相同。TPC的評測標準,有一個大問題是,評測的成本是太高了。以我比較熟悉的TPC-H為例,TPC-H包含22條測試SQL,有些SQL還是挺複雜的,很多資料庫甚至無法全部跑通這22條SQL。就算是能跑通TPC-H的資料庫,想要通過TPC-H的測試,也很麻煩。下圖是TPC-H 1TB榜單第一名的數據,我們可以看到,為了完成TPC-H 1TB的測試,這次測試使用的機器總價格約為31萬美元,摺合人民幣200多萬。如果想要測試10TB的版本,價格還要翻幾倍。機器的背後還有大量人力資源的投入,從我之前的經歷來看,進行一次TPC-H的測試,還需要大概幾十個人月的人力投入。對於人力資源成本非常高的IT業,這也是不小的一筆投資。

無法完成TPC測試,不代表一個資料庫沒有價值。讓更多的資料庫參與到有公信力的評測中來,這樣才能更好的實現取長補短,促進整個資料庫生態的發展。借用雲的計算能力來降低成本,是一個重要的方法。OceanBase此次推出的雲原生評測方式,大大降低了TPC的評測的門檻。


首先恭喜OB團隊和陽振坤老師。

看到這條新聞時激動的心情有點像在國慶閱兵式上看到DF-17的感覺,為中國能有這樣完全自主研發的商業資料庫而激動。當然也因為自己曾經參與其中而驕傲。資料庫是計算機領域能夠與操作系統比肩的核心方向,不知道阿里是否會因此被列入「實體名單」。

技術方面看,OB在TPCC測試的結果證明了share nothing架構、LSM引擎、MultiPaxos、分散式優化器執行器、優化的2PC事務等技術在分散式關係資料庫中的能力,也為後面其他國產資料庫跟隨者指明了一些技術路線。


我不想弄個嘩眾取寵的回答,但是實際情況是Oceanbase的第一有意義,不過含金量並不很高。理由如下

目前http://TPC.org官網的成績排名如下:

來源www.tpc.org

A. 第一是阿里Oceanbase v2.2,伺服器CPU是定製的x86至強處理器。

B. 第二是2010年的Oracle 11gR2,運行在Oracle自家的小型機平台,使用的是SPARC T3 CPU。

C. 第三上2010年的IBM DB2 9.7,運作在IBM自家的小型機平台,使用的是Power7 CPU。

D. 除了阿里,同樣使用x86 CPU tpmC成績次好的是排名第8的Oracle 11gR2,應該是運行在Oracle自家的Exadata x2-8機器上。

對於每項成績,http://tpc.org官網都可以點擊查看更詳細的信息。以上ABCD 4個成績,詳細信息如下:

A. 第一名/阿里

B. 第二名/Oracle

C. 第三名/IBM DB2

D. 第八名(x86第二名)/Oracle

可以看出,這4個成績的背後不光是資料庫軟體各不相同、提交時間跨度很大,從10年到19年。更需要留意的是,測試硬體配置也不具可比性——有x86有小型機,有單機有集群,從8CPU到420CPU,主頻從1.65GHz到3.86GHz,測試系統成本從450萬美元到5300萬美元。

我做了一個表格,便於得出比較的結論

如果僅看x86平台(單核看,Power太強,SPARC太弱),與第8名對比,在不考慮每core 0.1GHz的頻率優勢,以及9年來CPU架構改進帶來的性能優勢的情況下,OceanBase多用了84倍的core,性能提升了12倍

這裡需要說明的是,第八名的成績是在單機環境下取得的,任何一種資料庫多機集群的性能都無法達到完全線性的擴展,所以我們不能簡單的認為如果它的CPU數提高84倍,性能也能同樣提高84倍(可惜第二名的Oracle集群並不是運行在x86平台上,我們無法看到Oracle官方調優後TPC-C的擴展性如何)。但任何對Oracle有點深入了解的人都不太會相信,在TPC-C這樣的CPU密集場景下,如果集群CPU處理能力提升84倍以上,Oracle的交易性能擴展會難以達到12倍。

雖然我無法給出與OceanBase相同的硬體條件下,Oracle集群的可信成績(實時上每一家TPC-C測試的廠商都是在硬體不公平的情況下給出成績的。換句話說,TPC官方從來也不在意比較基礎是否公平,他只在意各廠家都向他提交測試結果,不然他的地位就難以維持了。多說句題外話,以前和Oracle總部做TPC測試的人聊過,他們說每個資料庫測試廠商都會為測試申請巨額費用——阿里這不用了3.8億人民幣么——購買特化的硬體,往往是存儲層面,用多到嚇人的盤數來保證I/O不會拖後腿。實際生產環境即使再有錢也不會這樣不合理的配置,所以我說這不是優化,而是特化。但站在資料庫廠家的角度看,這麼做並不算作弊,因為如果還有一點點I/O瓶頸,那怎麼能夠得出資料庫軟體的性能呢?),甚至也無法給出判斷,在這樣的硬體情況下,Oracle的性能估計會是20倍,100倍,或者只有10倍。但至少可以得出的結論是,以CPU處理能力提升倍數和交易性能提升倍數對比看,OceanBase的排名第一,含金量並不高。當然,如果只是從國產資料庫從零到一的進步角度看,確實還是有意義的。

也許Oracle會被阿里的成績刺激到,給出新的tmpC測試結果,這是值得我們期待的。


推薦閱讀:
相关文章