分層聚類,又稱層次聚類、系統聚類,顧名思義是指聚類過程是按照一定層次進行的。
數據分析過程中如果需要按變數(標題)聚類,那麼此時就應該使用分層聚類,並且結合聚類樹狀圖進行綜合判定分析。比如當前有8個裁判對於300個選手進行打分,試圖想對8個裁判進行聚類,以挖掘出裁判的打分偏好風格類別情況,此時則需要進行分層聚類。
分層聚類的基本思想是:
在聚類分析的開始,每個樣本(或變數)單獨作為一組,然後按照某種方法度量所有樣本(或變數)之間的親疏程度,把距離相近的先樣本(或變數)先聚成類,距離相遠的後聚成類,如此反覆,直到所有樣本(或變數)聚成一類為止。
分層聚類有幾點需要特別注意:
1:僅針對定量數據進行分層聚類;
2:如果數據的單位有較大差別,可首先對於數據進行標準化處理後,針對標準化數據進行分層聚類;
SPSSAU用戶可點擊 數據處理-生成變數-選擇標準化(S),進行數據標準化處理。