人脸识别常用的评估指标

2023-08-22 07:27| 来源: 网络整理| 查看: 265

导读

随着硬件性能的提升和人脸数据量的增大，人脸识别也越来越成熟，商业应用也越来越多。经常看到很多文章说，人脸识别算法做了什么什么改进在LFW上的识别准确率达到99.6%以上。

实际上，仅仅一个准确率指标是无法衡量一个模型的性能，准确率无法体现出人脸识别中最重要的指标通过率和拒绝率，通过率包含两种情况同一个人通过的概率和不同人通过的概率，拒绝率包含两种情况不同人被拒绝的概率和同一个人被拒绝的概率，通常我们希望模型在不同人通过率越低的情况下同一个人通过率越高越好，下面的评估指标主要也是基于这两个进行演化的。

人脸识别

现在人脸识别的应用多种多样，如人脸考勤、实名验证、身份验证、人脸支付以及天网系统等。实际上底层的实现技术主要还是依靠人脸验证和人脸搜索，人脸验证也称为1:1人脸匹配，人脸搜索也称为1:N人脸匹配。

首先我们从包含人脸的图片中通过人脸检测提取出人脸的位置信息以及人脸关键点，然后通过仿射变换结合人脸关键点进行人脸对齐，获取到对齐后的人脸图片。再将人脸图片通过人脸识别模型进行人脸特征提取，提取出来的特征是一个高维向量，这个向量的维度通常是128、256、512、1024甚至更高。

判断两张人脸图片是否相似的度量主要有两个指标欧式距离和余弦相似度。先通过人脸识别模型将人脸图片转换为特征向量。欧式距离顾名思义就是计算两个向量的欧式距离，所以两个向量的欧式距离越小表示他们越相似。余弦相似度就是计算两个向量的夹角的余弦值， c o s θ cos\theta cosθ的取值范围在 [ − 1 , 1 ] [-1,1] [−1,1]，我们可以对其进行归一化操作到 [ 0 , 1 ] [0,1] [0,1]通过 0.5 + 0.5 ∗ c o s θ 0.5+0.5*cos\theta 0.5+0.5∗cosθ来实现，余弦相似度越大表示是同一个人的概率越大。

无论是1:1人脸匹配还是1:N人脸匹配，我们都需要先确定一个阈值(欧式距离或相似度)，通常人脸相似的度量指标都是用的相似度，我们后面所说的阈值其实也就是一个相似度阈值。通过人脸数据集根据通过率或拒绝率来确定阈值，大于这个阈值表示为同一个人否则不是同一个人。

人脸验证

1:1人脸验证(verification)，比对两张图片是否为同一个人，常见的应用有火车站人脸闸机实名验证、手机人脸解锁等。通过判断比对图片的相似度是否大于阈值，常用的性能评估指标有如下几个

FAR FAR(False Accept Rate)认假率，表示错误的接受比例，与FPR(False Positive Rate)假正例率等价，指不是同一个人却被错误的认为是同一个人占所有不是同一个人比较的次数，计算公式如下 F A R = 非同人相似度 > T 非同人比较的次数 FAR = \frac{非同人相似度>T}{非同人比较的次数} FAR=非同人比较的次数非同人相似度>T F P R = F P F P + T N FPR = \frac{FP}{FP+TN} FPR=FP+TNFP 关于详细的混淆矩阵(TP、TN、FP、FN)说明，请参考我的另一篇文章分类算法中常用的评估指标TAR TAR(True Accept Rate)表示正确的接受比例，与TPR(True Positive Rate)真正率等价，指是同一个人且被正确的认为是同一个人占所有同一个人比较的次数，计算公式如下 T A R = 同人相似度 > T 同人比较的次数 TAR = \frac{同人相似度>T}{同人比较的次数} TAR=同人比较的次数同人相似度>T T P R = T P T P + F N TPR = \frac{TP}{TP+FN} TPR=TP+FNTPFRR FRR(False Reject Rate)错误拒绝率，与FNR(False Negative Rate)假负率，指是同一个人但被认为不是同一个人占所有是同一个人比较的次数，计算公式如下 F R R = 同人相似度 < T 同人比较的次数 FRR = \frac{同人相似度sj1,sj2.....sjn}，对集合 S S S进行由大到小的排序(用的欧式距离就是从小到大排序)。假定与 P j P_j Pj在gallery中对应人的是 g ∗ g* g∗，定义 r a n k ( P j ) = n rank(P_j)=n rank(Pj)=n表示 P j P_j Pj与 g ∗ g* g∗的相似度排在第n位， r a n k 1 rank1 rank1也称为 t o p m a t c h top\ match top match。

对于刷脸支付就是一个 t o p 1 top1 top1的open-set identification，人脸身份验证就是一个 t o p k topk topk的open-set identification。

闭集识别

闭集识别(close-set identification)：闭集识别需要解决的问题是，在gallery中找到probe P j P_j Pj， P j P_j Pj属于gallery中。与开集识别一样，闭集识别关心的也是在 t o p k topk topk中是否包含正确的识别结果。

评估指标

下面的评估指标在开集识别和闭集识别中都适用

DIR

DIR(Detection and Identification Rate)：指 P j ∈ P g P_j \in P_g Pj∈Pg与 G G G中的真实的结果 s ∗ s* s∗之间的相似度大于 τ \tau τ且大于其他所有与 P j P_j Pj不是同一个人的相似度在 P g P_g Pg中所占的比例，DIR衡量的是库内人员的通过性能。计算公式如下 P D I ( τ , 1 ) = ∣ { P j ∈ P g , r a n k ( P j ) = 1 , a n d P j ∗ > τ } ∣ ∣ P g ∣ P_{DI}(\tau,1)=\frac{|\{P_j\in P_g,rank(P_j)=1,and\ P_{j*}>\tau\}|}{|P_g|} PDI(τ,1)=∣Pg∣∣{Pj∈Pg,rank(Pj)=1,and Pj∗>τ}∣

下面我们来举例说明一下

假设G中有A、B、C三个人的人脸信息每个人有一张照片，Pj是属于C的另一张人脸照片，如果Pj与A、B、C的相似度分别为0.5、0.6、0.9，τ为0.7，那么此时才算是匹配正确。如果Pj与C的相似度为0.68 = τ } ∣ ∣ P n ∣ P_{FA}(\tau)=\frac{|\{P_j \in P_n,max_{i}(s_{ji})>=\tau\}|}{|P_n|} PFA(τ)=∣Pn∣∣{Pj∈Pn,maxi(sji)>=τ}∣ 对于1:N的人脸搜索来说，当FAR越低的情况下，DIR越高时，表示模型的性能越好，下面我们通过一个例子来说明一下，这两个评估指标是如何计算的

gallery(G)ABCP(g)a0.920.830.75b0.880.750.67c0.540.670.68P(n)d0.680.550.49e0.560.650.78f0.590.610.67

上表展示了 P g P_g Pg(照片在G中)和 P n P_n Pn(照片不在G中)在gallery(G)中的测试结果，a、b、c在G中分别对应A、B、C，d、e、f均不在G中。阈值 τ \tau τ取0.7时，我们来计算一下DIR和FIR

a与A的相似度最高，且 S a A > τ S_{aA} > \tau SaA>τ，所以匹配成功虽然b与B的相似度 S b B > τ S_{bB}>\tau SbB>τ，但 S b B < S b A S_{bB} < S_{bA} SbB

【本文地址】

公司简介

联系我们