查詢億級數據毫秒級返回！牛逼哄哄的ElasticSearch是如何做到的？

作者：石杉的架構筆記原文鏈接：http://mp.weixin.qq.com/s?__biz=MzU0OTk3ODQ3Ng==&mid=2247485379&idx=1&sn=d254376a5f8287d03eefc8c4351f20a1

1. 一道面試題的引入：

2. 性能優化的殺手鐧： Filesystem Cache

3. 數據預熱

4. 冷熱分離

5. ElasticSearch 中的關聯查詢

6. Document 模型設計

7. 分頁性能優化

一道面試題的引入：

如果面試的時候碰到這樣一個面試題：ElasticSearch（以下簡稱ES）在數據量很大的情況下（數十億級別）如何提高查詢效率？

這個問題說白了，就是看你有沒有實際用過 ES，因為啥？其實 ES 性能並沒有你想像中那麼好的。

很多時候數據量大了，特別是有幾億條數據的時候，可能你會懵逼的發現，跑個搜索怎麼一下 5~10s，坑爹了。

第一次搜索的時候，是 5~10s，後面反而就快了，可能就幾百毫秒。

然後你就很懵，每個用戶第一次訪問都會比較慢，比較卡么？所以你要是沒玩兒過 ES，或者就是自己玩玩兒 Demo，被問到這個問題容易懵逼，顯示出你對 ES 確實玩的不怎麼樣？

說實話，ES 性能優化是沒有銀彈的。啥意思呢？就是不要期待著隨手調一個參數，就可以萬能的應對所有的性能慢的場景。

也許有的場景是你換個參數，或者調整一下語法，就可以搞定，但是絕對不是所有場景都可以這樣。

性能優化的殺手鐧：Filesystem Cache

你往 ES 里寫的數據，實際上都寫到磁碟文件里去了，查詢的時候，操作系統會將磁碟文件里的數據自動緩存到 Filesystem Cache 裡面去。

整個過程，如下圖所示：

為什麼elasticsearch很適合日誌系統？在日誌方面相比與mysql的優勢是什麼？