基於pseudo label的學習模型和Loss形式

參考了論文Pseudo-Label : The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks

對於unlabeled date，選擇預測概率最大的作為該樣本的偽label，如下式：

$y = egin{cases} 1 & ext{if } i = argmax_{i} f(x) \ 0 & ext otherwise end{cases}$

不同的是：pseudo label用在了fine-tune階段。

Pre-trained Model用labeled和unlabeled的數據一起訓練

總結的Loss形式如下：

$L = frac{1}{n}sum_{m=1}^{n}sum_{i=1}^{C}L(y_i^m,f_i^m)+alpha(t)frac{1}{n}sum_{m=1}^{n}sum_{i=1}^{C}L({y}_i^m,{f}_i^m)$

n和n為mini batch的大小，C為類別個數，f為網路輸出，y和y分別為Label和pseudo label，α為平衡係數，是關於訓練時間t的函數。首先，在一開始α為0，模型只訓練有標記的樣本，從而儘快學習，之後α開始緩慢增加，知道達到某個迭代次數後，停止增加。從而實現半監督學習。

$alpha(t) = egin{cases} 0 & ext{ } t<T_1 \ frac{t-T_1}{T_2-T_1}alpha_f & ext{} T_1 le t le T_2 \ alpha_f & ext{} T_2 le t end{cases}$

使用pseudo label作為ground truth來訓練下一個網路，看了師兄paper reading上講的那兩篇,都是用Unlabeled data先過一遍網路得到pesudo label,後面的訓練在用這些pesudo label作為GT進行有監督的學習，損失函數的形式也是各個部分以平衡係數相加。