Java面試中常問的數據庫方面問題①

MySQL

爲什麼用自增列作爲主鍵

  1. 如果我們定義了主鍵(PRIMARY KEY),那麼InnoDB會選擇主鍵作爲聚集索引、如果沒有顯式定義主鍵,則InnoDB會選擇第一個不包含有NULL值的唯一索引作爲主鍵索引、如果也沒有這樣的唯一索引,則InnoDB會選擇內置6字節長的ROWID作爲隱含的聚集索引(ROWID隨着行記錄的寫入而主鍵遞增,這個ROWID不像ORACLE的ROWID那樣可引用,是隱含的)。
  2. 數據記錄本身被存於主索引(一顆B+Tree)的葉子節點上。這就要求同一個葉子節點內(大小爲一個內存頁或磁盤頁)的各條數據記錄按主鍵順序存放,因此每當有一條新的記錄插入時,MySQL會根據其主鍵將其插入適當的節點和位置,如果頁面達到裝載因子(InnoDB默認爲15/16),則開闢一個新的頁(節點)
  3. 如果表使用自增主鍵,那麼每次插入新的記錄,記錄就會順序添加到當前索引節點的後續位置,當一頁寫滿,就會自動開闢一個新的頁
  4. 如果使用非自增主鍵(如果身份證號或學號等),由於每次插入主鍵的值近似於隨機,因此每次新紀錄都要被插到現有索引頁得中間某個位置,此時MySQL不得不爲了將新記錄插到合適位置而移動數據,甚至目標頁面可能已經被回寫到磁盤上而從緩存中清掉,此時又要從磁盤上讀回來,這增加了很多開銷,同時頻繁的移動、分頁操作造成了大量的碎片,得到了不夠緊湊的索引結構,後續不得不通過OPTIMIZE TABLE來重建表並優化填充頁面。

爲什麼使用數據索引能提高效率

  1. 數據索引的存儲是有序的
  2. 在有序的情況下,通過索引查詢一個數據是無需遍歷索引記錄的
  3. 極端情況下,數據索引的查詢效率爲二分法查詢效率,趨近於 log2(N)

B+樹索引和哈希索引的區別

B+樹是一個平衡的多叉樹,從根節點到每個葉子節點的高度差值不超過1,而且同層級的節點間有指針相互鏈接,是有序的

Java面試中常問的數據庫方面問題①

哈希索引就是採用一定的哈希算法,把鍵值換算成新的哈希值,檢索時不需要類似B+樹那樣從根節點到葉子節點逐級查找,只需一次哈希算法即可,是無序的

Java面試中常問的數據庫方面問題①

哈希索引的優勢:

  1. 等值查詢。哈希索引具有絕對優勢(前提是:沒有大量重複鍵值,如果大量重複鍵值時,哈希索引的效率很低,因爲存在所謂的哈希碰撞問題。)

哈希索引不適用的場景:

  1. 不支持範圍查詢
  2. 不支持索引完成排序
  3. 不支持聯合索引的最左前綴匹配規則
相關文章