這樣我不知道研究意義和實用性,求助大佬幫忙解答一哈,困惑我好久了


可以再多介紹一些具體問題和場景嗎?


無監督學習作為標籤,被稱為自監督學習,比如自編碼器,輸入等於輸出,可以學習數據的內部結構和表達,有降維的作用,可能降低對標註數據量的要求,但不能替代監督式機器學習中的標籤


可以。這稱作「偽標籤」。


用無監督學習生成標籤再進行監督學習的訓練,在理論上是可行的。可以看一些 co-training,self-training和對noisy annotations做處理來提高監督學習精度類的文章。不過為了能得到比較好的效果,如果條件允許,還是建議做一部分manual labelling ,這樣問題難度會下降許多。


首先要了解課題需要用機器學習解決什麼樣的問題?

其次無監督機器學習可以直接解決這個問題,感覺先通過無監督造label的意義不大。

也就是說,原本就可以通過測試/預測數據與訓練數據放在一起直接無監督預測得出結果,為何還要先造label,再學習呢?


可以


可以是可以,但一般而言這種方式只會降低效果,機器學習的準確度評估有沒有意義了,為啥不直接使用無監督的學習替代。

不同的方法是手段啊,不是目的啊。


可以,但是沒有必要


最後你用的機器學習演算法會學成你使用的無監督演算法,這樣完全沒有意義啊


標一小部分數據,做半監督


沒有意義,這麼做很容易讓你監督模型過擬合到採用的無監督方法產生的數據分布上去。不如直接考慮使用無監督方法處理這個任務。

對監督方法有執念的話,可以考慮手動標一部分數據,然後採用半監督學習的方法,比如圖網路的標籤傳播,或者利用有標籤的數據訓練模型給無標籤數據生成偽標籤。再或者可以標註少量樣本後採用few-shot方法建立模型。

還有一條路就是有類似的數據集的話,可以採用遷移學習的方法


推薦閱讀:
相关文章