資料庫技術已經經歷了30多年的發展,不同的資料庫系統被設計用於不同規模的數據集和應用。傳統的關係資料庫系統難以解決大數據帶來的多樣性和規模的需求。由於具有模式自由、易於複製、提供簡單API、最終一致性和支持海量數據的特性,NoSQL資料庫逐漸成為處理大數據的標準。隨後將根據數據模型的不同,討論三種主流的NoSQL資料庫:鍵值(key-value)存儲資料庫、列式存儲資料庫和文檔存儲資料庫。
鍵值存儲是一種簡單的數據存儲模型,數據以鍵值對的形式儲存,鍵是唯一的。近年出現的鍵值存儲資料庫受到Amazon公司的Dynamo影響特別大。在Dynamo中,數據被分割存儲在不同的伺服器集羣中,並複製為多個副本。可擴展性和持久性依賴於以下兩個關鍵機制。