性能依然感人：在對象化存儲上無損部署大數據應用

一、簡介

隨著企業收集和分析的數據量不斷增長，人們越來越關注會影響到性能的數據存儲成本的管理。Hadoop提供了一種可擴展且快速的方式來存儲和分析數據，但在Hadoop中存儲數據通常比對象存儲等替代方案的成本更高。

對於尋求可擴展、經濟高效存儲的企業而言，內部部署和雲部署（例如AWS S3）採用對象存儲的方案更普遍。然而，對象存儲相較於Hadoop性能更低，因此程序開發者可能不願意在兩者間進行權衡選擇。企業注重成本優勢，雲服務提供商的定價透明，但沒有很好地解決成本與性能的權衡。

Alluxio是一個虛擬分散式文件系統，它創建了一個統一化各種不同存儲系統的數據層，並且可以達到內存級別的訪問速度。數據無論存儲在Hadoop HDFS中，還是對象存儲中，都可以通過全局命名空間中的單個源進行訪問。這使得企業可以設計兩全其美的數據存儲方案，即在利用低成本存儲的同時不降低性能。

常用鏈接

Alluxio項目官網
Alluxio Inc網站
Alluxio在各大廠用例
關注Alluxio微信公眾號

二、Alluxio概述

Alluxio是世界上第一個內存級別速度的虛擬分散式文件系統。它統一化數據訪問並橋接了計算框架和存儲。應用程序只需要與Alluxio連接即可訪問存儲在底層任何持久化存儲系統中的對象或文件數據。此外，Alluxio架構支持以內存級別速度訪問數據，以提供最快的I/O操作。

在大數據生態環境中，Alluxio是一個位於計算和存儲之間的數據層。它可以帶來明顯的性能提升，尤其在跨越多個數據中心的雲可用區。Alluxio抽象了底層持久化存儲系統中的對象或文件，為應用提供共享數據訪問。Alluxio兼容Hadoop和對象存儲，支持對持久化存儲的讀寫操作。現有的數據分析應用（如Hive，HBase和Spark SQL）可以直接在Alluxio上運行而無需更改任何代碼。三、當前的大數據存儲架構

最常見的大數據存儲架構包含了並置(co-located)的計算和存儲，具體地使用HDFS存儲系統作為MapReduce，Spark，Hive，Presto等計算框架的存儲，如圖1所示。數據和計算位於同一節點，計算和存儲緊耦合能夠帶來高性能但可擴展性和成本卻不容樂觀。擴展存儲的同時會迫使無需擴展的計算也進行了擴展（反之亦然）。隨著時間的推移，Hadoop集羣可能會變得龐大，並積累了大量較舊的，不太活躍的冷數據。

性能依然感人：在對象化存儲上無損部署大數據應用

常用鏈接

熱門新聞

週熱門

性能依然感人：在對象化存儲上無損部署大數據應用

常用鏈接

官方主動把巨大冰冷的國家機器美化為虛擬偶像。企圖使其飯圈化，這是不是變相？

如果這個世界真的是虛擬的，那麼這個世界是什麼，人類存在的意義又為何？

夢到底是一種什麼表現形式？

怎麼看待現在網路上流行起來的虛擬幣？

VR虛擬現實產品走進中央政治局集體學習現場，你怎麼看？

男大生很會！誆有ADIDAS鞋要賣 又騙買彩券賣點數判刑

阿凡達團隊進駐世新 「4D室、虛擬室、光雕投影室」打造8層媒體大樓

如果能和遊戲裏的NPC說一句話，你想說什麼?

瘋狂愛上遊戲裏的人物怎麼辦？

如果我們所處的世界是虛擬的，為什麼大部分人會堅決反對，是恐懼的心理狀況還是認為毫無依據而嗤之以鼻。？

人死了就是什麼都不知道了，那麼世界是不是大腦虛擬出來的？

散落在蠱毒之路上的回憶：虛擬少女們的故事

「環Mea生態圈」：VTuber神楽めあ在中國

SP-Cache: 基於選擇性熱點數據分割策略，實現分散式內存系統負載均衡

在公有雲實現分散式系統上千節點功能測試？Alluxio團隊基於Docker的模擬方案和經驗總結

熱門新聞

週熱門

男大生很會！誆有ADIDAS鞋要賣　又騙買彩券賣點數判刑

阿凡達團隊進駐世新　「4D室、虛擬室、光雕投影室」打造8層媒體大樓