編者按:本文由網友breeze_lsw原發於CSDN技術博客,徵得作者同意後在本專欄轉載。
一、為什麼要引入 Alluxio
- 通過監控發現計算節點的物理內存有富餘,不需要增加額外機器成本
- 機器網卡較為空閑,瓶頸主要存在於磁碟IO
- HDFS所在磁碟存在多種不同類型負載,數據讀取速度不穩定
- 熱數據讀取加速
- 存儲計算分離,在計算節點提高數據本地性
- 統一命名空間,虛擬數據湖
常用鏈接
- Alluxio項目官網
- Alluxio Inc網站
- Alluxio在各大廠用例
- 關注Alluxio微信公眾號
1.1 讀取數據的效率取決於哪些因素