台湾 || 语言: 大陆简体港澳繁體台灣正體

Small Cache, Big Effect

雪花台湾 2019-07-17 05:48

这篇文章是CMU Intel lab在2011年发表的，它高屋建瓴地提出：空间复杂度下界为O(nlogn)的cache（n为后端节点数）即可保证集群服务的负载均衡可靠性。建模和证明的过程非常巧妙，对cache design会很有启发。

摘要

在大规模的云计算服务中，为了避免后端节点过早暴露性能瓶颈、保证服务的SLO，以及更好地水平扩展，通常会在应用请求到达时经由一个load balancer处理，将请求平滑均匀地分发给后端节点。优秀的负载均衡能力是系统高吞吐，低延迟的前提。

但在生产环境中，没有cache加持的load balancer只能是阿克琉斯之踵：随著集群规模的动态变更，load balancer的partition规则不能保证负载被均匀地划分给各个后端节点；此外，请求负载的类型和分布无法预测，不排除DoS攻击的可能。系统设计者必须很小心地选择/组合load balancing策略，否则不同规格后端节点的处理能力将很容易成为系统瓶颈，被skewed load洪流击垮。

《Small Cache, Big Effect》提出：在load balancer中集成一层空间复杂度下界为O(nlogn)的cache（n为后端节点数！）来缓存热点数据，即可在显著提升load balancer吞吐量的同时，保证到达后端节点的请求负载是均匀分布的。

文中还给出了漂亮的证明过程和模拟结果，非常反直觉对吧？我们往下看。

small, fast cache at the front-end load balancer.

S = (p1, p2, ..., p(m)) — small, fast cache at the front-end load balancer.

相关文章