最近Pure Storage又在搞事。我特別怕Pure搞事,因為它在Sales&Marketing;上投入太大了,超過40%。因此,它一搞事,搞得人人都知道。

大家知道,Pure的產品其實就兩款,一個是針對結構化數據的FlashArray,一款是針對非結構化數據的FlashBlade。目前,FlashArray已經賣得很好了,幫助Pure連續5年成為Gartner固態存儲魔力象限領導者,未來的增長,Pure主要寄希望於FlashBlade。

為了賣好FlashBlade,必須包裝一個新概念,打擊老概念,這個新的概念就是Data Hub,這個data hub我都不知道如何翻譯,因此就不翻譯了。

Pure說,現在第二數據有很多孤島,不能做到很好的共享。因此一個企業有很多套第二存儲。

由於不同的場景對存儲要求不同,原來的老存儲架構很難同時滿足這些場景,因此,這是造成孤島的原因。

但是,DATA HUB能同時滿足這些場景的要求。

這個DATA HUB必須同時具有下面4個特徵。

這個產品就是FlashBlade。

其實套路很簡單,我們營銷一般也是這麼搞的。但是,為了讓大家加深印象,光創造一個data hub的概念是不夠的,還需要打擊傳統的data lake。

因此,Pure列舉了DATA LAKE(主要是傳統的計算存儲不分離的DAS形態)的種種缺點,襯托DATA HUB的種種優點。

Pure也知道,現在很多Data Lake不是DAS架構了,很多也是存儲和計算分離的,比如菊廠也在推獨立的數據湖方案(詳見為什麼大數據需要數據湖?)。

因此,Data Hub從本質來講,不是一個新的概念,也不是一個新的vision。

其實,按照Gartner的觀點,Data Hub,Data Lake和Warehouse各有側重,在一個企業都是需要的。Gartner說,

到2020年,使用包含Data Hub,Data Lake和Warehouse的緊密數據戰略的企業將獲得比競爭對手高30%的數據資產回報。

  • Data Warehouse— 支持大多數已知數據(結構化,事務性)和已知問題(可重複,廣泛使用),以便為運營業務提供共識。

  • Data Lake— 支持未知數據(較少有組織,原始和/或外生)和未知問題(以發現和數據科學為導向),以實現探索和創新。

  • Data Hub— 在生產和消費系統和流程之間實現可管理和受管理的數據共享。

一句話,Data Hub更強調數據的共享,因此,存儲廠商推廣這個比較容易銷售外部存儲。

還有,這三個術語也不是指某種產品,這只是三種體系架構,和具體的產品沒有必然聯繫。比如SAP和Cloudera也在推Data Hub的解決方案。

SAP Data Hub:

Cloudera Data Hub:

我在文章備份軟體老矣?存儲新風口——超融合第二存儲來了提到,很多公司都在做第二存儲創新,而且大多數都是從備份領域入手。

而Pure根據自己的產品特點(只有全快閃記憶體),抓住AI熱潮,硬生生把第二存儲對性能要求比較高的負載分出來,炒作Data Hub的概念,放大Data Hub的優勢,誘導用戶把數據放到自己的FlashBlade上。

Pure說,第二存儲沒有分層,只有冷熱。熱的第二數據還是在全快閃記憶體上,只有冷數據才需要用到HDD。

西瓜哥覺得,如果Cohesity做得好一點,比如推出全快閃記憶體節點,可以把Pure的高性能場景也納入的話,也不是不行。


推薦閱讀:
相关文章