FID指标复现踩坑避坑 文本生成图像FID定量实验全流程复现(Fréchet Inception Distance )定量评价实验踩坑避坑流程 您所在的位置:网站首页 书籍尺寸大小怎么算出来的图片 FID指标复现踩坑避坑 文本生成图像FID定量实验全流程复现(Fréchet Inception Distance )定量评价实验踩坑避坑流程

FID指标复现踩坑避坑 文本生成图像FID定量实验全流程复现(Fréchet Inception Distance )定量评价实验踩坑避坑流程

2024-07-10 23:13| 来源: 网络整理| 查看: 265

目录 一、FID分数简介二、FID分数 CUB定量实验步骤2.1、下载FID计算代码2.2、下载FID预训练好的模型2.3、输入终端命令2.4、注意事项 最后

一、FID分数简介

FID全称为:Fréchet Inception Distance。

FID分数用于根据预训练网络提取的特征,测量真实图像分布和生成图像分布之间的距离。真实图像在空间中是服从一个分布的(假设为正态分布),而GAN生成的特征也是一个分布,GAN做的事情就是不断训练使这两个分布尽可能的相同。FID就是计算这两个分布直接的距离,使用的距离算法叫做Frechet distance。

FID计算两个分布之间的距离,距离越小代表生成的分布越贴近于真实分布,故FID越小越好。

二、FID分数 CUB定量实验步骤 2.1、下载FID计算代码

github下载:https://github.com/MinfengZhu/DM-GAN/tree/master/eval/FID

在这里插入图片描述 将其放入code目录中 在这里插入图片描述

2.2、下载FID预训练好的模型

谷歌云盘链接:https://drive.google.com/file/d/1747il5vnY2zNkmQ1x_8hySx537ZAJEtj CSDN链接:FID训练好的模型 针对CUB-birds的FID预训练模型

CSDN链接:FID训练好的模型 针对COCO的FID预训练模型

下载后是一个npz文件,将其放入指定文件夹位置 在这里插入图片描述

2.3、输入终端命令

打开终端,输入命令为:python fid_score.py --gpu 0 --batch-size 24 --path1 eval/FID/bird_val.npz --path2 ../test/valid/single 其中后面的两个参数path1代表你放FID预训练的模型所在位置,path2代表你放生成的图片的位置。

运行后显示: 在这里插入图片描述

2.4、注意事项

1、计算FID一般需要30000张生成图像,如果只有3000张是测不准的; 2、计算FID的标准方法目前还不统一,用不用imagenet 预训练的参数测出来的FID也不一样,本篇仅仅是一种做法,目前看来可能还不够严谨,仅供参考。

最后

💖 个人简介:人工智能领域研究生,目前主攻文本生成图像(text to image)方向

📝 个人主页:中杯可乐多加冰

🔥 限时免费订阅:文本生成图像T2I专栏

🎉 支持我:点赞👍+收藏⭐️+留言📝

另外,我们已经建立了微信T2I学习交流群,如果你也是T2I方面的爱好者或研究者可以私信我加入。

如果这篇文章帮助到你很多,希望能不吝打赏我一杯可乐!多加冰哦!



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有