Hyperspectral image classification via a random patches network

作者: Yonghao Xu, Bo Du, Fan Zhang, Liangpei Zhanga

主要工作: 普通深度網路結構用於高光譜圖像分類,因為要進行預訓練和微調導致耗時太多,文中提出一種基於Random Patches Network (RPNet) 的高光譜圖像分類方法,不同於普通深度框架, 它直接從圖像中隨機選擇若干個塊兒(Random Patches)視為卷積核而且無需任何訓練。 通過結合淺層和深層卷積特徵,RPNet具有多尺度的優點,高光譜分類效果好。

存在問題:

目前基於深度網路的高光譜圖像分類的方法,分別提取光譜、空間信息或者空譜聯合信息,然後分類,存在如下問題:

  • 網路結構訓練和微調耗時量大;
  • 大量參數導致深度網路的複雜度高;
  • 需要大量訓練樣本;
  • 僅利用最深層的特徵來進行分類。

核心概念:

隨機投影, 是一種簡單有效的降維方式,在隨即投影中,原始的 d 維數據使用隨機矩陣將映射到 k 維子空間( k<<d )。通過隨機投影不同類別之間的邊緣可以保持完好,在低維空間中僅需要少量樣本來訓練分類器。

RPNet 網路結構示意圖(2層)

演算法步驟:

  1. PCA和白化:原始高光譜數據 X^{r	imes c	imes d} ,其中 r,c,d 分別為行數,列數和光譜特徵數目。 為降低卷積操作計算成本,首先, 用 PCA對原始數據進行降維,僅保留前 p 個主成分, 得到數據 X^{r 	imes c 	imes p}; 其次, 對數據進行白化操作, 目的是減小不同類別數據之間的相關性,有利於分類;
  2. 隨機塊的卷積:從白化數據中隨機選擇 k 個像素及其周圍的窗口大小為 w	imes w 	imes p 的圖像塊,得到 k 個隨機塊。 對於分布在圖像邊緣的那些像素,通過增補空白像素完成。通過將白化數據與隨機區域塊作為卷積核進行操作得到 k 個特徵圖;
  3. 非線性激活:第一層中卷積特徵記為: Iin R^{r	imes c 	imes k} 。為保持特徵的稀疏結構,利用線性單元作為激活函數。

f(I) = max(0, I-M)

M = [m_{2}, ...,m_{2}]in R^{r 	imes c 	imes k}

其中, m_{2} in R^{r 	imes c 	imes 1} 表示 I 中第二維數據的平均向量, M 是重複 km_{2} 組成的平均矩陣。最後,第一層特徵表示為

Z^{(1)} = f(I)in R^{r 	imes c 	imes k}

4. 深層特徵提取:記 Z^{(L-1)}in R^{ r	imes c 	imes k} 為第 L-1 層特徵。為提取第 L 層中特徵,可以將 Z^{(L-1)} 作為新的輸入數據。通過堆棧方式,可以得到不同層的特徵

[Z^{(1)},Z^{(2)},...,Z^{(L)}]= f(I)in R^{r 	imes c 	imes kL}

5. SVM分類

文章代碼:YonghaoXu/RPNet


推薦閱讀:
相关文章