時間序列的聯動分析
原文鏈接:時間序列的聯動分析
背景介紹
在互聯網公司裡面,通常都會監控成千上萬的時間序列,用於保障整個系統或者平台的穩定性。在這種情況下,如果能夠對多條時間序列之間判斷其是否相關,則對於監控而言是非常有效的。基於以上的實際情況,清華大學與 Alibaba 集團在2019年一起合作了論文《CoFlux: Robustly Correlating KPIs by Fluctuations for Service Troubleshooting》,並且發表在 IWQos 2019 上。CoFlux 這個方法可以對多條時間序列來做分析,並且主要用途包括以下幾點:
- 告警壓縮和收斂;
- 推薦與已知告警相關的 Top N 的告警;
- 在已有的業務範圍內(例如資料庫的實例)構建異常波動傳播鏈;