时间序列的联动分析
原文链接:时间序列的联动分析
背景介绍
在互联网公司里面,通常都会监控成千上万的时间序列,用于保障整个系统或者平台的稳定性。在这种情况下,如果能够对多条时间序列之间判断其是否相关,则对于监控而言是非常有效的。基于以上的实际情况,清华大学与 Alibaba 集团在2019年一起合作了论文《CoFlux: Robustly Correlating KPIs by Fluctuations for Service Troubleshooting》,并且发表在 IWQos 2019 上。CoFlux 这个方法可以对多条时间序列来做分析,并且主要用途包括以下几点:
- 告警压缩和收敛;
- 推荐与已知告警相关的 Top N 的告警;
- 在已有的业务范围内(例如资料库的实例)构建异常波动传播链;