台湾 || 语言: 大陆简体港澳繁體台灣正體

深度分析Spark最新大殺器Delta Lake

雪花臺灣 2019-07-19 15:02

DataBricks最近新開源了一個項目Delta Lake。這其實不算是個新項目了。DataBricks在其商業版裡面提供這樣的功能已經有一段時日了。對我來說Delta Lake就是久聞大名，但是不知道廬山真面目。

當然以DataBricks一貫的既要為人民服務，更要為人民幣服務的做法，開源出來的Delta Lake肯定不是其內部商業版的全部。但是即便如此也可以讓我們管中窺豹了。

文章分兩部分。第一部分介紹一下Delta Lake的一些情況，主要是基於：

https://youtu.be/whaV6bMaf5o

的內容。如果要看原版視頻的話，可能需要一點科學上網的技巧。講課的小哥是DataBricks的大神Michael Armburst。他負責Structured Stream和Delta Lake。第二部分會給出我個人的一些看法。

相關文章