你瞭解什麼是B+Tree嗎

作者：冬瓜蔡
來源：https://www.cnblogs.com/dongguacai/p/7241860.html

B+Tree的定義

B+Tree是B樹的變種，有着比B樹更高的查詢性能，來看下m階B+Tree特徵：

1、有m個子樹的節點包含有m個元素（B-Tree中是m-1）

2、根節點和分支節點中不保存數據，只用於索引，所有數據都保存在葉子節點中。

3、所有分支節點和根節點都同時存在於子節點中，在子節點元素中是最大或者最小的元素。

4、葉子節點會包含所有的關鍵字，以及指向數據記錄的指針，並且葉子節點本身是根據關鍵字的大小從小到大順序鏈接。

更直觀的圖

1、紅點表示是指向衛星數據的指針，指針指向的是存放實際數據的磁盤頁，衛星數據就是數據庫中一條數據記錄。

2、葉子節點中還有一個指向下一個葉子節點的next指針，所以葉子節點形成了一個有序的鏈表，方便遍歷B+樹。

B+樹的優勢

1、更加高效的單元素查找

B+樹的查找元素3的過程：

第一次磁盤IO

第二次磁盤IO

第三次磁盤IO

這個過程看下來，貌似與B樹的查詢過程沒有什麼區別。但實際上有兩點不一樣：

a、首先B+樹的中間節點不存儲衛星數據，所以同樣大小的磁盤頁可以容納更多的節點元素，如此一來，相同數量的數據下，B+樹就相對來說要更加矮胖些，磁盤IO的次數更少。

b、由於只有葉子節點才保存衛星數據，B+樹每次查詢都要到葉子節點；而B樹每次查詢則不一樣，最好的情況是根節點，最壞的情況是葉子節點，沒有B+樹穩定。

2、葉子節點形成有順鏈表，範圍查找性能更優

B樹範圍查找3-8的過程

a、先查找3

b、再查找4、5、6、7、8，中間過程省略，直接到8的查找

這裏查找的範圍跨度越大，則磁盤IO的次數越多，性能越差。

B+樹範圍查找3-11的過程

先從上到下找到下限元素3，然後通過鏈表指針，依次遍歷得到元素5/6/8/9/11；如此一來，就不用像B樹那樣一個個元素進行查找。

總結

1.單節點可以存儲更多的元素，使得查詢磁盤IO次數更少。

2.所有查詢都要查找到葉子節點，查詢性能穩定。

3.所有葉子節點形成有序鏈表，便於範圍查詢。

PS:在數據庫的聚集索引（Clustered Index）中，葉子節點直接包含衛星數據。在非聚集索引（NonClustered Index）中，葉子節點帶有指向衛星數據的指針。

參考文獻：
【1】很直觀的圖：http://www.jianshu.com/p/6f68d3c118d6
【2】《算法導論》

你瞭解什麼是B+Tree嗎

熱門新聞

週熱門

你瞭解什麼是B+Tree嗎

你對JIRA工具瞭解多少？揭祕敏捷實用工具JIRA的前世今生！

程序員小灰-漫畫：優秀的程序員具備哪些屬性？

兩天才黑客：一人牢獄之災後退隱江湖，一人蛻變成阿里“守護神”

Spring Boot如何優雅的整合Mybatis

基於HTTP協議的幾種實時數據獲取技術

這可能是學習Python最好的免費在線電子書

一個螞蟻程序員，曾經的辛酸面試歷程

知名互聯網公司網站架構圖

2018年，比爾蓋茨最愛的五本書

程序員吐槽：面試的技術崗卻要我去招人？網友：老鐵，發個郵箱

JAVA設計模式總結之23種設計模式

Java中堆內存和棧內存詳解

Java中BIO,NIO,AIO的理解

高危行業？程序員不僅禿得早，還會死的早！

什麼是B-Tree

熱門新聞

週熱門