这样我不知道研究意义和实用性,求助大佬帮忙解答一哈,困惑我好久了


可以再多介绍一些具体问题和场景吗?


无监督学习作为标签,被称为自监督学习,比如自编码器,输入等于输出,可以学习数据的内部结构和表达,有降维的作用,可能降低对标注数据量的要求,但不能替代监督式机器学习中的标签


可以。这称作「伪标签」。


用无监督学习生成标签再进行监督学习的训练,在理论上是可行的。可以看一些 co-training,self-training和对noisy annotations做处理来提高监督学习精度类的文章。不过为了能得到比较好的效果,如果条件允许,还是建议做一部分manual labelling ,这样问题难度会下降许多。


首先要了解课题需要用机器学习解决什么样的问题?

其次无监督机器学习可以直接解决这个问题,感觉先通过无监督造label的意义不大。

也就是说,原本就可以通过测试/预测数据与训练数据放在一起直接无监督预测得出结果,为何还要先造label,再学习呢?


可以


可以是可以,但一般而言这种方式只会降低效果,机器学习的准确度评估有没有意义了,为啥不直接使用无监督的学习替代。

不同的方法是手段啊,不是目的啊。


可以,但是没有必要


最后你用的机器学习演算法会学成你使用的无监督演算法,这样完全没有意义啊


标一小部分数据,做半监督


没有意义,这么做很容易让你监督模型过拟合到采用的无监督方法产生的数据分布上去。不如直接考虑使用无监督方法处理这个任务。

对监督方法有执念的话,可以考虑手动标一部分数据,然后采用半监督学习的方法,比如图网路的标签传播,或者利用有标签的数据训练模型给无标签数据生成伪标签。再或者可以标注少量样本后采用few-shot方法建立模型。

还有一条路就是有类似的数据集的话,可以采用迁移学习的方法


推荐阅读:
相关文章