StyleGAN v1 :用于生成高质量图像数据的生成对抗方法 | 您所在的位置:网站首页 › 图像数据的表示方法 › StyleGAN v1 :用于生成高质量图像数据的生成对抗方法 |
StyleGAN是2018年的一篇文章,目前已经被TPAMI收录,该方法能够生成高质量的图像数据并且做到了高层特征可控,v1的主要工作在于设计了一个style-based生成器,其中包括了styles mixing的策略,图像随机特征的生成方式以及自适应的实例正则化的设计。 StyleGAN v1论文地址 工程地址 StyleGan v1的主要工作,是对将有效的信息latent code表示直接灌给输入层的传统生成器的重新设计,如下图所示: ![]() 理解style-based生成器的设计需要从以下几个要点出发: 1 非线性映射层 不同于直接将latent code灌给输入层,style-based生成器首先将latent code通过一个8层的全连接层进行非线性映射 ![]() 在将 另外,上面提到生成器由18层网络组成,对应处理分辨率 ![]() 生成的图片,分别选取来自B的不同分辨率的style控制变量(其余选取A中的styles),可以看到选取分辨率 其实最开始接触这个模型,是想用父母的人脸照片,来进行二者孩子长相的预测,控制选取分辨率较小的宝宝脸图像的styles与一方融合生成中间结果,再重复一步得到预测的宝宝照片,类似于 https://github.com/tg-bomze/BabyGAN,但是生成的图像感觉五官特征与父母照片特征还是不太明显。 3 常量输入 StyleGAN生成图像的特征是由 图像中往往存在一些随机的区域,比如头发的纹理,人脸的雀斑等,为了生成的图像更加逼真,需要将这些小特征插入GAN图像,常用方法是在输入向量中添加随机噪声。为了控制噪声仅影响图片样式上细微的变化,StyleGAN采用类似于AdaIN机制的方式添加噪声,即在AdaIN模块之前向每个通道添加一个缩放过的噪声,并稍微改变其操作的分辨率级别特征的视觉表达方式。加入噪声后的生成人脸往往更加逼真与多样。【a是每一层都添加噪音,b是没有噪音,c是指在精细的 在生成器结构中,高斯噪音通过一个权重 ![]() 以上~ 欢迎关注 深度学习与数学 [获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读,算法和其他互联网技能的学习,概率论、线性代数等高等数学知识的回顾] ![]() |
CopyRight 2018-2019 实验室设备网 版权所有 |