GFS論文筆記

一、引言

首先GFS的設計目標包括易擴展，幾乎線性擴展成大規模的集羣運;行在通用和廉價的硬體上提供可靠的容錯機制並且滿足高吞吐的性能要求。

在論文的開頭就對GFS系統的運行作了假設： 1. 硬體失效是經常發生的，因為伺服器都是通用的相對於廉價的硬體(不過現在Google都已經全部用定製化的企業級硬體了); 2. 數GB到數TB的大文件，Google的大數據場景，數據都非常的大，單個數據文件都非常的大，另外有一點是大文件可以減少文件的數量，降低元數據的數量; 3. 寫一次讀多次，而且幾乎是追加寫，很少覆蓋寫，讀也大塊順序讀較多; 4. 不兼容通用的POSIX文件介面，採用應用與系統一體的設計，這樣他的IO路徑不需要經過內核態的inode等，縮短了IO的路徑。5. 高帶寬比低時延更重要，這是由Google本身的業務場景所決定的;

二、基本架構

GFS主要是包括3種基本角色：client、master、chunk server，client實現各種API以庫的形式提供給業務應用使用;master是全局元數據的管理者，包含name space管理，chunk數據分佈管理等等，它是GFS集羣的核心; chunk server即是實現數據存儲，把文件切分成chunk分成多副本存儲到多個chunk server上實現數據的可靠性;

1. client

client提供的介面不是POSIX介面，主要提供以下create/delete/open/close/read/write/snapshot/record append 等功能介面。client作為api庫鏈接到具體的應用它不需要經過內核態的inode層。直接通過網路訪問chunk server 或者master更加的高效;它從master獲取metadata並緩存在本地內存中，然後直接與chunk server交互，讀寫IO不必每次都經過master，使master不會成功瓶頸;

client側不提供數據cache機制，主要出於以下原因考慮： 1. 應用場景為大文件的順序讀，需要大內存，而且收益很低; 2. cilent的設計更簡單，client有cache的話需要複雜的機制才能保證多client之間的數據一致性，比如分散式鎖等; 3. chunkserver用的是本地文件系統具有buffer cache，它會緩存經常訪問的數據，這樣chunk server側在一定程度上緩存了熱點數據;

一、引言

二、基本架構

1. client

讀流程

寫流程

原子追加寫

2. master

元數據

chunk的租約

垃圾回收

operation log

副本控制

1. 數據分佈的目標:

2. 數據分佈只要考慮以下三點:

3. 副本複製

4. 負載均衡

3. ChrunkServer

大塊chunk的優缺點

chunk server執行垃圾回收的優缺點

三、數據一致性模型

1. 文件創建修改原子性

2. 文件修改

3. 客戶端程序保證

四、其它

1. snapshot

打快照流程

2. 高可用性

1. 快速恢復

2. 數據多副本

3. 數據完整性

1. checksum

2. 後臺掃描

4. 診斷工具

熱門新聞

週熱門

GFS論文筆記

一、引言

二、基本架構

1. client

讀流程

寫流程

原子追加寫

2. master

元數據

chunk的租約

垃圾回收

operation log

副本控制

1. 數據分佈的目標:

2. 數據分佈只要考慮以下三點:

3. 副本複製

4. 負載均衡

3. ChrunkServer

大塊chunk的優缺點

chunk server執行垃圾回收的優缺點

三、數據一致性模型

1. 文件創建修改原子性

2. 文件修改

3. 客戶端程序保證

四、其它

1. snapshot

打快照流程

2. 高可用性

1. 快速恢復

2. 數據多副本

3. 數據完整性

1. checksum

2. 後臺掃描

4. 診斷工具

超長文本，用什麼資料庫儲存？

現在會後端，想從安卓客戶端開始學然後搞到前端，，在跳到後端，最後做成全棧可行麼?

有沒有像分散式存儲一樣，硬體級別的分散式內存?

分散式存儲做存儲負載平衡時，怎麼處理新來的讀寫請求呢？

ShardingSphere x Seata，一致性更強的分散式資料庫中間件

TiKV 源碼解析系列文章（十）Snapshot 的發送和接收

區塊鏈擴容方案之—分片（sharding）

直面PHP微服務架構挑戰

論文翻譯：Haystack

Linux伺服器設計（五）：大文件存儲簡析

LevelDB 寫操作源碼分析--寫入限制

phxpaxos源碼分析5. init network (下)

JITStack(集特)：「Ceph淺析」系列之一——Ceph概況

一篇文章讓你理解Ceph的三種存儲介面(塊設備、文件系統、對象存儲)

Paper Reading: GFS

熱門新聞

週熱門