台湾 || 语言: 大陆简体港澳繁體台灣正體

GAN生成的數據沒有標籤怎麼用來訓練分類模型？

雪花臺灣 2021-01-30 10:28

用GAN生成的數據和已有數據集合併在一起輸入進CNN裡面做分類，但是GAN生成的數據沒有標籤怎麼辦？

謝邀。主要是看GAN生成樣本的質量，來決定怎麼用。最基本的質量判斷是兩個指標：真實性（realism）和多樣性（diversity）。生成的圖像不光要真實，還要多樣（舉例來說，人臉的GAN不能只會生成成龍的臉，要生成訓練集之外的），最重要是能符合原始數據集的分佈。這樣用GAN生成數據訓練出來的模型纔不會跑偏。

如果生成圖像質量不太好，可以考慮用這些圖像作為outlier，來讓模型不識別這些樣本。我們ICCV17最早是利用DCGAN來生成樣本，那時候圖像的尺度還是致命的（基本64x64就還行，但往上效果就不好了）。所以 Unlabeled Samples Generated by GAN Improve the Person Re-identification Baseline in vitro 的工作就利用了label smooth的思路，用不太好的GAN樣本，來正則網路學習。假設有N個類別，本質思想就是讓網路對於生成樣本都預測一個1/N 的平均概率。思路主要來自於InceptionNet-v3中 label smooth的想法（https://arxiv.org/abs/1512.00567）。

來自 https://heartbeat.fritz.ai/stylegans-use-machine-learning-to-generate-and-customize-realistic-images-c943388dc672?gi=a1fce64bcd0a

來自 https://heartbeat.fritz.ai/stylegans-use-machine-learning-to-generate-and-customize-realistic-images-c943388dc672?gi=a1fce64bcd0a

相關文章