我想把一組數據進行分類,分類的種類由我自己指定,比如說,分成5類,但是我不會提前給數據加上標籤,讓機器自己去進行分類,自動分成5類數組,而且希望能夠把每一類數組都有一組特徵值能夠來進行描述,想問問大家,有沒有什麼合適的分類演算法嗎?


kmeans,然後分析每一類的共同特徵


你難道不就是在說聚類嗎。聚類中心就是你要的那組用來描述每一類的特徵值


聚類,精度沒保證,特徵維度一高kmeans這些演算法基本失效因為高維空間歐幾里得距離失效需要進行一些特殊處理比如子空間搜索,如果維度太低也不一定效果好因為你壓根也不知道手上的特徵是不是有效特徵。


k-means + dicision tree,這樣分類確實就是k-means標準計算類型,不過依據特徵,這個可能需要dicision tree做最優分類特徵選擇


這難道不是聚類問題嗎?k-means可以使用


聚類演算法不就可以嗎?有什麼問題嗎?


推薦閱讀:
相关文章