台湾 || 语言: 大陆简体港澳繁體台灣正體

時間序列的聚類

雪花臺灣 2019-03-10 05:30

時間序列的聚類

在機器學習領域，聚類問題一直是一個非常常見的問題。無論是在傳統的機器學習（Machine Learning）領域，還是自然語言處理（Natural Language Processing）領域，都可以用聚類演算法做很多的事情。例如在數據分析領域，我們可以把某個物品用特徵來描述出來，例如該房子的面積，價格，朝向等內容，然後使用聚類演算法來把相似的房子聚集到一起；在自然語言處理領域，通常都會尋找一些相似的新聞或者把相似的文本信息聚集到一起，在這種情況下，可以用 Word2Vec 把自然語言處理成向量特徵，然後使用 KMeans 等機器學習演算法來作聚類。除此之外，另外一種做法是使用 Jaccard 相似度來計算兩個文本內容之間的相似性，然後使用層次聚類（Hierarchical Clustering）的方法來作聚類。

mathbb{R}^{m}

相關文章