優秀的數據工程師，怎麼用 Spark 在 TiDB 上做 OLAP 分析

作者：RickyHuo

本文轉載自公眾號「大道至簡bigdata」。

原文鏈接：優秀的數據工程師，怎麼用Spark在TiDB上做OLAP分析

TiDB 是一款定位於在線事務處理/在線分析處理的融合型資料庫產品，實現了一鍵水平伸縮，強一致性的多副本數據安全，分散式事務，實時 OLAP 等重要特性。
TiSpark 是 PingCAP 為解決用戶複雜 OLAP 需求而推出的產品。它藉助 Spark 平台，同時融合 TiKV 分散式集群的優勢。直接使用 TiSpark 完成 OLAP 操作需要了解 Spark，還需要一些開發工作。那麼，有沒有一些開箱即用的工具能幫我們更快速地使用 TiSpark 在 TiDB 上完成 OLAP 分析呢？目前開源社區上有一款工具 Waterdrop，可以基於 Spark，在 TiSpark 的基礎上快速實現 TiDB 數據讀取和 OLAP 分析。項目地址：https://github.com/InterestingLab/waterdrop