持久化（7）：日誌文件系統

在看文章前可以先看下這個，

吳海波：專欄的序

先有個大概的認識會對閱讀有所幫助。

到目前為止我們所看到的文件系統就是管理一組數據結構，以實現預期的抽象：文件、目錄和所有其他元數據。與大多數數據不同(例如內存中的數據)，文件系統的數據必須能長時間保存，也就是說，這些存儲設備斷電也可以保留數據。因此文件系統面臨的一個主要挑戰是在系統崩潰的情況下，應該怎麼保證數據正確的存儲。具體來說，如果在更新磁碟的過程中，有人把電源線絆掉，會發生什麼情況呢？或者操作系統遇到錯誤並崩潰呢？由於電源損耗和崩潰，更新持久數據結構可能非常棘手，這些問題，統稱為崩潰一致性問題。

因此，我們有一個所有文件系統都需要解決的問題：系統在任何兩次寫入之間都可能崩潰或失去電源，因此磁碟上的數據可能只得到部分保存。考慮到崩潰可能發生在任意時間點，我們如何確保文件系統將磁碟映像保持在合理的狀態？在本章中，我們將介紹一些文件系統用來克服這個問題的方法。我們將首先介紹舊文件系統(稱為fsck或文件系統檢查器)所採取的方法。然後，我們將注意力轉向另一種方法，稱為日誌記錄，這種技術為每一次寫入增加了一些開銷，但從崩潰或斷電中恢復會更快。

文件系統不一致的問題

讓我們先看一個例子。我們使用某種工作負載（workload）的方式更新磁碟。這裡假設工作負載很簡單：將單個數據塊附加到現有文件中。完成附加操作的方法是打開文件，調用lseek()將文件偏移到文件末尾，然後在關閉文件之前對文件發出一個4KB的寫入。我們還假設在磁碟上使用的是標準的簡單文件系統結構，類似於我們前面章節的文件系統。這個小小的例子包括一個inode點陣圖(只有8位，每個inode一個)，一個數據點陣圖(也是8位，每個數據塊一個)，inode(總共8個，編號為0到7，分布在四個塊)和數據塊(總共8個，編號為0到7)。下面是這個文件系統的圖示：