InfoGAN学习笔记(四)

4 人赞了文章

  • InfoGAN

InfoGAN是NIPS2016年提出来的GAN网路。

论文地址:arxiv.org/abs/1606.0365

-----------------------------------------------------------------------------------------------

这篇paper所要达到的目标就是通过非监督学习得到可分解的特征表示,使用GAN加上最大化生成的图片和输入编码之间的互信息。最大的好处就是可以不需要监督学习,而且不需要大量额外的计算花销就能得到可解释的特征。

通常,我们学到的特征是混杂在一起的,如下图所示,这些特征在数据空间中以一种复杂的无序的方式进行编码,但是如果这些特征是可分解的,那么这些特征将具有更强的可解释性,我们将更容易利用这些特征进行编码。

GAN通过生成器与判别器的对抗学习,最终可以得到一个与real data分布一致的fake data,但是由于生成器的输入z是一个连续的杂讯信号,并且没有任何约束,导致GAN无法利用这个z,并且无法将z的具体维度与数据的语义特征对应起来,并不是一个可解释的表示。

即从表征学习的角度来看GAN,会发现由于生成器使用杂讯z的时候没有加任何的限制,而是在以一种高度混合的方式使用z,导致z的任何一个维度都没有明显的表示一个特征,所在在数据生成的过程中,我们无法得知什么样的杂讯z可以用来生成数字1,什么样的杂讯z可以用来生成数字3。对于z的每一个维度不能够很好的对应到相关的语义特征,从这一点就限制了我们对GAN的有效利用

论文中有一个disentangled representation,意为数据的解耦表示。在这里面解释一下:无监督学习是一个病态问题,因为相关的下游任务通常是未知的,而数据的解耦表示对于相关的,但是下游是未知的任务有比较好的结果,它用于显示表示数据的显著特征。比如:对于人脸,一个有用的解耦表示就是将人脸的表情、眼镜颜色和是否戴眼镜等一个个特征分别表示一个特征维度,每个维度的不同取值表示各个特征的取值。

而InfoGAN针对上面的现象,提出把输入的杂讯向量分成两部分:(1)z,可以看成是输入的杂讯向量。(2)c,对应的语义向量。其中Info代表互信息,它表示生成数据x与隐藏编码c之间关联程度大小。

InfoGAN提出一种无监督的方式,让生成网路输入杂讯变数z、隐藏编码c,即生成数据可以表示成:G(z,c)。然而,在标准GAN中,如果直接这样作为网路的输入进行训练,那么生成器将忽略隐藏编码的作用,或者可以看成z与c相互独立、不相关。为了解决这个问题,文章提出正则化约束项:隐藏编码c与生成样本G(z,c)的互信息量应该较大,即I(c;G(z,c))应该较大。其中有关互信息的结束如下所示:

I(x,y)可以看成X在给定Y与否的条件下b不确定性的差值。如果X,Y相互独立,那么I(x,y) = 0,反之如果X与Y相关性较大,那么I(x,y)也较大。因此对于I(c;G(z,c))来说,如果想让它更大,可以通过使Pg(c|x)更小。

为此在原始GAN损失函数V(D,G)的基础上,提出了正则约束I(c;G(z,c)):

也就是在生成网路损失部分加入了互信息的惩罚

论文中给出了推倒的过程,截图如下(本人不懂):

-----------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------

随后文章对公式进行建模,使InfoGAN等价为三个网路结构:

  • 生成网路x=G(c,z)
  • 判别真伪网路y1=D-1-(x)
  • 判别类别c网路y2=D-2-(x)

文章用神经网路参数化辅助分布Q(c|x),这也是一个判别网路模型,就是给定输入样本x,判别对应的类别(c对应类别标签);与D网路的差别在于,D网路用语判别真伪;与D网路的共性在于,Q与D是参数共享网路,除了最后一层的分类层之外,因为D网路的最后一层是二分类,而Q网路则可能是其他的多分类,也可能是回归问题。具体网路结构如下图b所示:

-----------------------------------------------------------------------------------------------

网上其他InfoGAN介绍参考:

blog.csdn.net/u01169999

blog.csdn.net/hjimce/ar

原文笔记:

http://note.youdao.com/noteshare?id=e12d4740adaee1ecd01ab3e01f61996a&sub=80524ECED4C44E33AD56ECB2459A11BC?

note.youdao.com

-----------------------------------------------------------------------------------------------


推荐阅读:
查看原文 >>
相关文章