【机器学习】机器学习模型训练与测试评估 您所在的位置:网站首页 为什么要进行建模 【机器学习】机器学习模型训练与测试评估

【机器学习】机器学习模型训练与测试评估

2024-07-15 19:35| 来源: 网络整理| 查看: 265

模型训练 模型选择

对于特定任务最优建模方法的选择或者对特定模型最佳参数的选择

交叉验证 在训练数据集上运行模型(算法)并且在测试数据集上测试效果,迭代 更新数据模型的修改,这种方式被称为“交叉验证”(将数据分为训练集 和 测试集),使用训练集构建模型,并使用测试集评估模型提供修改建议。

模型的选择会尽可能多的选择算法进行执行,并比较每个算法的执行结果

模型测试

模型的测试一般从以下几个方面来进行比较:准确率、召回率、精确率、F值、ROC、AUC

混淆矩阵

在这里插入图片描述

准确率

准确率(Accuracy) = 提取出的正确样本数/总样本数 A c c u r a c y = T P + T N T P + T N + F P + F N Accuracy = \frac{TP+TN}{TP+TN+FP+FN} Accuracy=TP+TN+FP+FNTP+TN​

召回率

召回率(Recall) = 正确的正例样本数/样本中正例样本数 ——覆盖率 R e c a l l = T P T P + F N Recall = \frac{TP}{TP+FN} Recall=TP+FNTP​

精确率

精确率(Precision) = 正确的正例样本数/预测为正例的样本数 P r e c i s o n = T P T P + F P Precison = \frac{TP}{TP+FP} Precison=TP+FPTP​

F值

F值 = Precision * Recall * 2 / (Precision + Recall) 即正确率和召回率的调和平均值 F = 2 1 P r e c i s i o n + 1 R e c a l l F = \frac{2}{\frac{1}{Precision} + \frac{1}{Recall}} F=Precision1​+Recall1​2​

ROC

ROC描述的是分类混淆矩阵中FPR-TPR两个量之间的相对变化情况,ROC曲线的纵轴是“真正例率(TPR)”,横轴是“假正例率(FPR)”。

如果二元分类输出的是对正样本的一个分类概率值,当去不同阀值时会得到不同的混淆矩阵,对应于ROC曲线上的一个点。那么ROC曲线就反映了FPR和TPR之间权衡的情况,通俗地来说,即在TPR随着FPR递增的情况下,谁增长得更快,快多少的问题。

TPR增长得越快,曲线越往上屈,AUC就越大,反映了模型的分类性能就越好。当正负样本不平衡时,这种模型评价方式比起一般的精确度评价方式的好处尤其显著。

在这里插入图片描述

AUC

AUC的值越大表示模型越好

AUC被定义为ROC曲线下的面积,显然这个面积的数值不会大于1,又由于ROC曲线一般都处于 y = x y = x y=x 这条直线的上方,所以AUC取值范围在0.5和1之间。

使用AUC值作为评价标准是因为很多时候ROC曲线并不能清晰的说明哪个分类器的效果好,而AUC作为数值可以直观的评价分类器的好坏,值越大越好。 AUC = 1,是完美分类器,采用这个预测模型时,不管设定什么阀值都能得出完美预测。绝大数预测的场合,不存在完美分类器; AUC = 0.5,跟随机猜测一样,模型没有预测价值; 0.5 < AUC < 1,由于随机猜测,妥善设定阀值,有预测价值; AUC < 0.5,比随机猜测还差,但只要总是反预测而行,比随机猜测好。

模型评估 回归算法评估方式 指标描述scikit-learn函数Mean Square Error(MSE, RMSE)平均误差from sklearn.metrics import mean_squared_errorAbsolute Error(MAE, RAE)绝对误差from sklearn.metrics import mean_absolute_error,median_absolute_errorR-SquaredR平方值from sklearn.metrics import r2_score 分类算法评估方式 指标描述scikit-learn函数Precision精确度from sklearn.metrics import precision_scoreRecall召回率from sklearn.metrics import recall_scoreF1F1值from sklearn.metrics import f1_scoreConfusion Matrix混淆矩阵from sklearn.metrics import confusion_matrixROCROC曲线from sklearn.metrics import rocAUCROC曲线下的面积from sklearn.metrics import auc


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有