腾讯老照片修复算法开源，细节到头发丝，3种预训练模型可下载

2024-07-10 10:46| 来源: 网络整理| 查看: 265

明敏发自凹非寺量子位 | 公众号 QbitAI

还记得这个能将老照片修复到纤毫毕现的GFPGAN吗？

现在，它的代码正式开源了！

官方已经在GitHub上传了3个预训练模型，3个版本的效果区别如下：

其中，V1.3是最近更新的一版，修复效果更加自然。同时还能在低质量输入的情况下，输出高质量结果。

自上线以来，GFPGAN已经在GitHub上揽星1.7w+，还曾登顶过热榜第一。

更是在推特上引起过一波试玩热潮：

这一项目由腾讯PCG ARC实验室提出，其相关论文已被CVPR2021收录。

3种预训练模型可挑选

开源代码主要分为预训练和训练两个部分。

预训练中以GFPGAN的V1.3版本为例，给出了预训练模型的下载地址：

代码语言：javascript复制wget https://github.com/TencentARC/GFPGAN/releases/download/v1.3.0/GFPGANv1.3.pth -P Experiments/pretrained_models

然后，只需一行代码就能开始预训练模型推理了：

代码语言：javascript复制python inference_gfpgan.py -i inputs/whole_imgs -o results -v 1.3 -s 2

具体介绍如下：

代码语言：javascript复制Usage: python inference_gfpgan.py -i inputs/whole_imgs -o results -v 1.3 -s 2 [options]... -h show this help -i input Input image or folder. Default: inputs/whole_imgs -o output Output folder. Default: results -v version GFPGAN model version. Option: 1 | 1.2 | 1.3. Default: 1.3 -s upscale The final upsampling scale of the image. Default: 2 -bg_upsampler background upsampler. Default: realesrgan -bg_tile Tile size for background sampler, 0 for no tile during testing. Default: 400 -suffix Suffix of the restored faces -only_center_face Only restore the center face -aligned Input are aligned faces -ext Image extension. Options: auto | jpg | png, auto means using the same extension as inputs. Default: auto

在这里，官方还展示了3种预训练模型的区别在哪里。

与初始版本相比，后两版在修复精度上有了明显提升。

V1.2的锐化更明显，同时还带有一些美颜效果，所以在一些情况下会比较假面。

V1.3明显解决了这一问题，使得输出更加自然，还能进行二次修复；不过弊端是人物面部特征有时会发生变化（比如下图中的安妮·海瑟薇示例）。

总之，V1.3并不完全优于V1.2，大家可以按需选取合适的模型。

接下来到了训练部分。

首先，数据集选用FFHQ；

然后，将下载好的预训练模型其他数据放在experiments/pretrained_models文件夹里。

其他数据包括：

预训练好的StyleGAN2模型，FFHQ人脸对齐模型文件和ArcFace模型。

接下来，修改相对应的配置文件options/train_gfpgan_v1.yml。

在这里，也可以尝试不使用人脸对齐的简单版本options/train_gfpgan_v1_simple.yml。

最后，就可以开始训练了。

代码语言：javascript复制python -m torch.distributed.launch —nproc_per_node=4 —master_port=22021 gfpgan/train.py -opt options/train_gfpgan_v1.yml —launcher pytorch

此外，官方还有两则提醒。

第一，输入更多高质量的人脸图像，可以提高修复的效果。

第二，训练中可能需要进行一些图像预处理，比如美颜。

如果你选择训练V1.2版本，官方还给出了微调指南：

GFPGAN V1.2采用了clean架构，更加方便部署；它是从一个双线性模型转换而来，因此需要对其原有模型微调，然后再进行转换。

Demo试玩

除了开源代码，官方也早已开通了多个线上试玩通道。

在这里，我们用HuggingFace来给大家展示具体效果。

先来看看修复后的蒙娜丽莎女士，不仅面部的噪点都被去掉了，甚至连头发上的纱巾都清晰可见。