最近在IPFS的項目中,就是否使用RAID,大家討論得比較多。所以趁熱打鐵,整合以前自己寫的舊文,簡單介紹一下。

使用存儲系統,大家最關心的是數據的安全。但這個「安全」,可包羅萬象了。以下情況,大家都會認為是安全問題。

  1. 買了一個玻璃硬碟,搞幾天就壞了,導致數據丟了。不安全!
  2. 伺服器的電源壞了,暫時無法工作。雖然硬碟的數據還存在,但是,現在訪問不了這個數據。不安全!
  3. 因為某種不可描述的原因,導致網線被拔了,存儲歇菜了。不安全!
  4. 要被老闆開除了,心懷怨恨,在走之前,干一票大的,悄悄地把公司的數據全部給刪除。對於公司來說,顯然不安全!
  5. 我是一個快樂的程序員,一邊給女朋友打電話一邊敲命令,很酷。哎呀,不對,剛才rm -rf了。刪除的不是我的臨時文件,而是資料庫目錄!!!……找到了背鍋俠,就是這個鍵盤不好,剛才cd沒有跳出這個目錄,字母d沒有打出來……嚴重的不安全!
  6. 我是一個黑客。最近風聲緊,不敢幹大的。但聽說有大量的IPFS礦場出來了……反正Windows漏洞多,隨便植入幾個木馬,讓大家都為我挖Filecoin……這個當然不安全!

湊了上面幾個例子,感覺好累。但實際上,出現數據風險的場景之多,遠遠超出想像。我想,對於某些想賺錢的童鞋來說,安全是一個最重要的因素,否則再便宜的機器都是白搭。我也可以確保,沒有人能說自己的存儲絕對安全。剛才說Windows漏洞多,Linux漏洞也不少,還有大量的躺著沒有發現呢!

上面的這些所謂安全問題,其實,差別大著呢,應對的技術也大不相同。不知道業界有沒有什麼專業的術語,按照我自己的定義,可以劃分如下:

  1. 物理安全。因為硬體故障導致的數據丟失或不可訪問。比如硬碟損壞、伺服器損壞。上面的例子1、2、3都屬於物理安全。
  2. 邏輯安全。因為人為的操作,導致數據的破壞。比如,有意或者無意地刪除文件。上面的4、5都屬於邏輯安全。
  3. 網路安全。這個和系統漏洞以及網路管理的不嚴格相關,屬於我們討論的傳統「黑客入侵」問題。比如上面的例子6。

同時,從另一個維度看,數據訪問故障又分兩大類:

  1. 數據業務連續性問題。比如,一台伺服器掉線,導致部分數據無法訪問,業務受到影響。按照現在大家猜測的IPFS挖礦規則,掉線到一定時間,Filecoin就會受到懲罰。這個問題,屬於Data Availability的問題,許多高可用的集群,都通過高可用性HA(High Availability)技術來解決這個問題,確保單點故障不會影響到業務系統。
  2. 數據丟失。這個問題比前一個問題嚴重多了。就是數據找不到了——嗚嗚,如果真的有什麼懲罰機制的話,自然是最嚴重的懲罰了。RAID5損壞兩塊硬碟,就容易導致此問題。在分散式存儲的項目中,遇到過大量因為元數據伺服器故障導致許多數據無法找到的情況。

所以,針對這些問題,我準備簡單些一個系列的文章。當然,就隨便寫寫了,有什麼問題大家也可以指出,一起討論。預計系列的文章為:

大話存儲數據安全之物理安全——RAID保護

大話存儲數據安全之物理安全——分散式多副本保護

大話存儲數據安全之物理安全——糾刪碼保護

大話存儲數據安全之物理安全——其他保護手段

大話存儲數據安全之邏輯安全——備份、快照和版本

大話存儲數據安全之邏輯安全——用戶許可權和操作規則

大話存儲數據安全之網路安全——……

大家的意見如何呢?

更多技術問題,可以通過QQ群進行交流:

IPFS討論:738880773

高性能分散式存儲討論:183098754

storswift.com


推薦閱讀:
相关文章