Incremental View Maintenance over Array Data【SIGMOD』17】

科學探索過程中產生了越來越多的多維數據,這些數據主要是用分散式陣列資料庫(distributed array databases)來處理。這些原始數據使用複雜耗時的流水線式的處理後得到相應的數據產品,這樣做的結果是,數據產品生成或發布的頻率很低,導致該數據產品產生的結論過時。作者引入具象陣列視圖(materialized array views)作為科學數據產品的資料庫結構。作者將數據處理過程看作批量更新的增量視圖維護操作,並給出一個三階段的啟發式方法來發現更有效的更新計劃。此外,啟發式方法將陣列和視圖重新劃分成一個個連續的基於過去的更新窗口的序列,這樣的劃分是該方法的副產物。作者設計了一個分析成本的模型,用於整合查詢中的具象陣列視圖。實驗中使用天文數據,對該方法進行評估,發現該方法能增量維護真實的天文數據產品。

作者在文中定義的陣列視圖(數組視圖,array view)並不適合直接存儲於已有的陣列資料庫(數組資料庫,array databases);作者將增量陣列視圖維護看作歷史視圖的批量更新,並基於此使用啟發式演算法來優化更新維護操作;作者將此方法放到了真實的天文數據上進行實驗和應用,並得出了比較好的結果。


更多內容請關注微信公眾號「論文精選」以及微信小程序「SkimPaper」,每天準時為您推薦體系結構、分散式系統、人工智慧等相關領域優秀論文解讀。同時也歡迎大家積極投稿,分享您讀到的優秀論文。

推薦閱讀:

相关文章