論文題目:Outlier Detection for Multidimensional Time Series using Deep Neural Networks (發表在MDM2018上,作者單位:丹麥艾爾堡大學)

這篇文章方法並不複雜,但提供了一個好的思路

首先將原始的時間序列通過滑動窗口的形式,對每個窗口內的序列做特徵提取,然後將提取的特徵送給 AutoEncoder。在檢測時,若 AutoEncoder 的重建 error 大於某個閾值,則認為是異常。

可啟發的點:

  • 原始的時間序列往往面臨維度高,存在雜訊等情況,通過特徵提取,對原始數據進行清洗和豐富等,會比直接將原始數據扔給神經網路要好;
  • AutoEncoder 是一種典型的無監督方法,可以將其擴展為 variational AutoEncoder,或者引入情景信息,從而擴展為 Conditional Variational AutoEncoder。

接下來講具體的方法……

方法

本文主要包含兩部分:Time Series Enrichment + Deep Neural Network Based Autoencoder (2DCNN-AE 和 LSTM-AE 分別對應的神經網路是 CNN 和 LSTM)

Time Series Enrichment

Enrichment 分為兩步:

step 1:

如上圖所示,以b為大小的滑動窗口,對窗口內多變數時間序列的每一個維度提取以下兩種特徵:

如下圖所示,如果時間序列變數維度為3,則每一個窗口中數據變為2*3。

step 2:

在 step 1 的基礎上,以 f 為窗口大小,對於 NOR 和 DOR 特徵,分別在每個變數上抽取8種統計量,最後數據維度為16*3。

Deep Neural Network Based Autoencoder

這一部分就是基於 CNN/LSTM 網路的 Autoencoder。

本文最後又做了一個補充,在Autoencoder中引入情境信息。(最簡單的情境信息就是類別、時間等)


推薦閱讀:
相关文章