不同的Nosql,其實應用的場景各有不同,所以我們應該先了解不同Nosql之間的差別,然後分析什麼纔是最適合我使用的Nosql。

Nosql介紹

Nosql的全稱是Not Only Sql,這個概念早起就有人提出,在09年的時候比較火。Nosql指的是非關係型資料庫,而我們常用的都是關係型資料庫。就像我們常用的mysql,sqlserver一樣,這些資料庫一般用來存儲重要信息,應對普通的業務是沒有問題的。但是,隨著互聯網的高速發展,傳統的關係型資料庫在應付超大規模,超大流量以及高並發的時候力不從心。而就在這個時候,Nosql得到的告訴的發展。

Nosql和關係型資料庫的區別

1.存儲方式

關係型資料庫是表格式的,因此存儲在表的行和列中。他們之間很容易關聯協作存儲,提取數據很方便。而Nosql資料庫則與其相反,他是大塊的組合在一起。通常存儲在數據集中,就像文檔、鍵值對或者圖結構。

2.存儲結構

關係型資料庫對應的是結構化數據,數據表都預先定義了結構(列的定義),結構描述了數據的形式和內容。這一點對數據建模至關重要,雖然預定義結構帶來了可靠性和穩定性,但是修改這些數據比較困難。而Nosql資料庫基於動態結構,使用與非結構化數據。因為Nosql資料庫是動態結構,可以很容易適應數據類型和結構的變化。

3.存儲規範

關係型資料庫的數據存儲為了更高的規範性,把數據分割為最小的關係表以避免重複,獲得精簡的空間利用。雖然管理起來很清晰,但是單個操作設計到多張表的時候,數據管理就顯得有點麻煩。而Nosql數據存儲在平面數據集中,數據經常可能會重複。單個資料庫很少被分隔開,而是存儲成了一個整體,這樣整塊數據更加便於讀寫

4.存儲擴展

這可能是兩者之間最大的區別,關係型資料庫是縱向擴展,也就是說想要提高處理能力,要使用速度更快的計算機。因為數據存儲在關係表中,操作的性能瓶頸可能涉及到多個表,需要通過提升計算機性能來克服。雖然有很大的擴展空間,但是最終會達到縱向擴展的上限。而Nosql資料庫是橫向擴展的,它的存儲天然就是分散式的,可以通過給資源池添加更多的普通資料庫伺服器來分擔負載。

5.查詢方式

關係型資料庫通過結構化查詢語言來操作資料庫(就是我們通常說的SQL)。SQL支持資料庫CURD操作的功能非常強大,是業界的標準用法。而Nosql查詢以塊為單元操作數據,使用的是非結構化查詢語言(UnQl),它是沒有標準的。關係型資料庫表中主鍵的概念對應Nosql中存儲文檔的ID。關係型資料庫使用預定義優化方式(比如索引)來加快查詢操作,而Nosql更簡單更精確的數據訪問模式。

6.事務

關係型資料庫遵循ACID規則(原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)),而Nosql資料庫遵循BASE原則(基本可用(Basically Availble)、軟/柔性事務(Soft-state )、最終一致性(Eventual Consistency))。由於關係型資料庫的數據強一致性,所以對事務的支持很好。關係型資料庫支持對事務原子性細粒度控制,並且易於回滾事務。而Nosql資料庫是在CAP(一致性、可用性、分區容忍度)中任選兩項,因為基於節點的分散式系統中,很難全部滿足,所以對事務的支持不是很好,雖然也可以使用事務,但是並不是Nosql的閃光點。

7.性能

關係型資料庫為了維護數據的一致性付出了巨大的代價,讀寫性能比較差。在面對高並發讀寫性能非常差,面對海量數據的時候效率非常低。而Nosql存儲的格式都是key-value類型的,並且存儲在內存中,非常容易存儲,而且對於數據的 一致性是 弱要求。Nosql無需sql的解析,提高了讀寫性能。

8.授權方式

關係型資料庫通常有SQL Server,Mysql,Oracle。主流的Nosql資料庫有redis,memcache,MongoDb。大多數的關係型資料庫都是付費的並且價格昂貴,成本較大,而Nosql資料庫通常都是開源的。

Redis,Memcache,MongoDb的特點與區別

Redis

優點

  1. 支持多種數據結構,如 string(字元串)、 list(雙向鏈表)、dict(hash表)、set(集合)、zset(排序set)、hyperloglog(基數估算)

  2. 支持持久化操作,可以進行aof及rdb數據持久化到磁碟,從而進行數據備份或數據恢復等操作,較好的防止數據丟失  的手段。

  3. 支持通過Replication進行數據複製,通過master-slave機制,可以實時進行數據的同步複製,支持多級複製和增量複製,master-slave機制是Redis進行HA的重要手段。

  4. 單線程請求,所有命令串列執行,並發情況下不需要考慮數據一致性問題。

  5. 支持pub/sub消息訂閱機制,可以用來進行消息訂閱與通知。

  6. 支持簡單的事務需求,但業界使用場景很少,並不成熟。

缺點

  1. Redis只能使用單線程,性能受限於CPU性能,故單實例CPU最高才可能達到5-6wQPS每秒(取決於數據結構,數據大小以及伺服器硬體性能,日常環境中QPS高峯大約在1-2w左右)。

  2. 支持簡單的事務需求,但業界使用場景很少,並不成熟,既是優點也是缺點。

  3. Redis在string類型上會消耗較多內存,可以使用dict(hash表)壓縮存儲以降低內存耗用。

Memcache

優點

  1. Memcached可以利用多核優勢,單實例吞吐量極高,可以達到幾十萬QPS(取決於key、value的位元組大小以及伺服器硬體性能,日常環境中QPS高峯大約在4-6w左右)。適用於最大程度扛量。

  2. 支持直接配置為session handle。

缺點

  1. 只支持簡單的key/value數據結構,不像Redis可以支持豐富的數據類型。

  2. 無法進行持久化,數據不能備份,只能用於緩存使用,且重啟後數據全部丟失。

  3. 無法進行數據同步,不能將MC中的數據遷移到其他MC實例中。

  4. Memcached內存分配採用Slab Allocation機制管理內存,value大小分佈差異較大時會造成內存利用率降低,並引發低利用率時依然出現踢出等問題。需要用戶注重value設計。

MongoDB

優點

  1. 更高的寫負載,MongoDB擁有更高的插入速度。

  2. 處理很大的規模的單表,當數據表太大的時候可以很容易的分割表。

  3. 高可用性,設置M-S不僅方便而且很快,MongoDB還可以快速、安全及自動化的實現節點(數據中心)故障轉移。

  4. 快速的查詢,MongoDB支持二維空間索引,比如管道,因此可以快速及精確的從指定位置獲取數據。MongoDB在啟動後會將資料庫中的數據以文件映射的方式載入到內存中。如果內存資源相當豐富的話,這將極大地提高資料庫的查詢速度。

  5. 非結構化數據的爆發增長,增加列在有些情況下可能鎖定整個資料庫,或者增加負載從而導致性能下降,由於MongoDB的弱數據結構模式,添加1個新欄位不會對舊錶格有任何影響,整個過程會非常快速。

缺點

  1. 不支持事務。

  2. MongoDB佔用空間過大 。

  3. MongoDB沒有成熟的維護工具。

Redis、Memcache和MongoDB的區別

1. 性能

三者的性能都比較高,總的來講:Memcache和Redis差不多,要高於MongoDB。

2. 便利性

memcache數據結構單一。

redis豐富一些,數據操作方面,redis更好一些,較少的網路IO次數。

mongodb支持豐富的數據表達,索引,最類似關係型資料庫,支持的查詢語言非常豐富。

3. 存儲空間

redis在2.0版本後增加了自己的VM特性,突破物理內存的限制;可以對key value設置過期時間(類似memcache)。

memcache可以修改最大可用內存,採用LRU演算法。

mongoDB適合大數據量的存儲,依賴操作系統VM做內存管理,喫內存也比較厲害,服務不要和別的服務在一起。

4. 可用性

redis,依賴客戶端來實現分散式讀寫;主從複製時,每次從節點重新連接主節點都要依賴整個快照,無增量複製,因性能和效率問題,所以單點問題比較複雜;不支持自動sharding,需要依賴程序設定一致hash 機制。一種替代方案是,不用redis本身的複製機制,採用自己做主動複製(多份存儲),或者改成增量複製的方式(需要自己實現),一致性問題和性能的權衡。

Memcache本身沒有數據冗餘機制,也沒必要;對於故障預防,採用依賴成熟的hash或者環狀的演算法,解決單點故障引起的抖動問題。

mongoDB支持master-slave,replicaset(內部採用paxos選舉演算法,自動故障恢復),auto sharding機制,對客戶端屏蔽了故障轉移和切分機制。

5. 可靠性

redis支持(快照、AOF):依賴快照進行持久化,aof增強了可靠性的同時,對性能有所影響。

memcache不支持,通常用在做緩存,提升性能。

MongoDB從1.8版本開始採用binlog方式支持持久化的可靠性。

6. 一致性

Memcache 在並發場景下,用cas保證一致性。

redis事務支持比較弱,只能保證事務中的每個操作連續執行。

mongoDB不支持事務。

7. 數據分析

mongoDB內置了數據分析的功能(mapreduce),其他兩者不支持。

8. 應用場景

redis:數據量較小的更性能操作和運算上。

memcache:用於在動態系統中減少資料庫負載,提升性能;做緩存,提高性能(適合讀多寫少,對於數據量比較大,可以採用sharding)。

MongoDB:主要解決海量數據的訪問效率問題。


推薦閱讀:
相關文章