聚類,顧名思義,就是將原本無規律的數據,通過比較數據之間的相似性,找出它們的聯繫,將差別小的數據分為一類,保證不同類別之間的差別較大。聚類研究一般是對研究的樣本人羣進行分析,把人羣劃分為不同類別,再對不同類別人羣的差異進行分析。
聚類分析與因子分析
分析時很多人容易把聚類和因子分析的概念弄混,其實兩者既有聯繫也有區別。
因子分析:分為探索性因子分析和驗證性因子分析,多用來分析問卷效度、濃縮信息、計算權重或者分析綜合競爭力。比如將20個題濃縮為5個關鍵詞。
聚類分析:分為樣本聚類和變數聚類,通常比較常用樣本聚類,比如有500個人,這500個人可以聚成幾個類別。
在研究中,可以先做因子分析濃縮題項信息,也就是把多個題濃縮成幾個變數,得到因子得分。然後將因子得分進一步聚類分析,得到幾個類別羣體,可用於後續的研究。
思路框架