YOLOv5训练结果分析

推荐

狼籍 2024-02-06 14:22 2024/02/06 ©著作权读给你听

文章标签 专栏分类人工智能 阅读数6171 评论数0 点赞数0 收藏数0

导读：本文的目的是帮助理解每次训练后在runs/train文件夹下出现的一系列文件并探索如何评估准确率以及模型的好坏。一...

本文的目的是帮助理解每次训练后在runs/train文件夹下出现的一系列文件并探索如何评估准确率以及模型的好坏。

一.混淆矩阵—confusion_matrix.png

毕设跑的train有混淆矩阵但是有点扯需要跑一下鸟类的验证一下(待验证)

1.概念

混淆矩阵是对分类问题预测结果的总结。使用计数值汇总正确和不正确预测的数量并按每个类进行细分显示了分类模型进行预测时会对哪一部分产生混淆。

混淆矩阵不仅可以让我们直观的了解分类模型所犯的错误更重要的是可以了解哪些错误类型正在发生正是这种对结果的分解克服了仅使用分类准确率带来的局限性。

2.图文理解实际类1类2类3预测类14352类22453类30149

(1)横轴时预测类别纵轴是真实类别

(2)表格里的数目总数为150 表示共有150个测试样本

(3)每一行之和为50 表示每类各有50个样本每一行代表了真实的目标被预测为其他类的数量比如第一行 43代表真实的类一中有43个被预测为类一 5个被错预测为类2,2个被错预测为类3

二.TP/TN/FP/FN 1.逻辑关系

T(True) 最终预测结果正确。

F(False) 最后预测结果错误。

P(Positive) 模型预测其是正例(目标本身是个鱼模型也预测它是个鱼)。

N(Negative) 模型预测其是负例(目标本身是个鱼但模型预测它是个猫)。

TP 样本的真实类别是正例并且模型预测的结果也是正例预测正确(目标本身是个鱼模型也预测它是鱼预测正确还有一种理解方式模型预测它是正例最终预测结果是正确的所以目标是个正例))。

TN 样本的真实类别是负例并且模型将其预测成为负例预测正确(目标本身不是鱼模型预测它不是了鱼是个其他的东西预测正确还有一种理解方式模型预测它是负例最终预测结果是正确的所以目标是个负例))。

FP 样本的真实类别是负例但是模型将其预测成为正例预测错误(目标本身不是鱼模型预测它是鱼预测错误还有一种理解方式模型预测它是正例最终预测结果是错误的所以目标是个负例)。

FN 样本的真实类别是正例但是模型将其预测成为负例预测错误(目标本身是鱼模型预测它不是鱼是个其他的东西预测错误还有一种理解方式模型预测它是负例最终预测结果是错误的所以目标是个正例)。

2.几个指标

(1)正确率/准确率(accuracy) $\frac{}{}$ $\frac{TP TN}{TP TN FP FN}$ ;

注通常来说正确率越高模型越好。

(2)错误率 $\frac{FP FN}{TP TN FP FN}$ ;

(3)灵敏度(sensitive) $\frac{TP}{TP FN}$

注表示的是所有正例中被分对的比例衡量了分类器对正例的识别能力

(4)特征度/特异度(specificity) $\frac{TN}{TN FP}$

注表示的是所有负例中被分对的比例衡量了分类器对负例的识别能力

(5)精确率(precision) $\frac{TP}{TP FP}$

注表示被分为正例的示例中实际为正例的比例

(6)召回率(recall) $\frac{TP}{TP FN}$

注度量有多个正例被分为正例

3.label.jpg

第一张图 classes(每个类别的数据量)

第二个图 labels(框的尺寸和数量)

第三个图 center (框的中心点坐标)

第四个图 labels width and height(框的长和宽)

4.P_curve(精确率和置信度的关系图)

精确率(查准率) 表示被分为正例的示例中实际为正例的比例

解释设置置信度为某一数值的时候各个类别识别的精确率。

可以看到当置信度越大的时候类别检测的越准确。这也很好理解只有置信度很大才被判断是某一类别。但这样的话会漏检一些置信度低的类别。

比如运行程序时即便某个目标是鱼模型预测它也是鱼但是给它的置信度只有70% 当置信度设置在80%时才认为是鱼时这个目标就会被忽略了。

5.R_curve(召回率和置信度的关系图)

召回率(查全率) 度量有多个正例被分为正例

解释设置置信度为某一数值的时候各个类别查全的概率。可以看到当置信度越小的时候类别检测的越全面。

6.先验知识 $\rightarrow$ 综合recall和precision

Precision和Recall通常是一对矛盾的性能度量指标。一般来说 Precision越高时 Recall往往越低。

原因是如果我们希望提高Precision 即二分类器预测的正例尽可能是真实正例那么就要提高二分类器预测正例的门槛。例如之前预测正例只要置信度 $\geq$ 0.5的样例我们就标注为正例那么现在要提高到置信度 $\geq$ 0.7我们才标注为正例这样才能保证二分类器挑选出来的正例更有可能是真实正例而这个目标恰恰与提高Recall相反如果我们希望提高Recall 即二分类器尽可能地将真实正例挑选出来那么势必要降低二分类器预测正例的门槛例如之前预测正例只要置信度 $\geq$ 0.5的样例我们就标注为真实正例那么现在要降低到 $\geq$ 0.3我们就将其标注为正例这样才能保证二分类器挑选出尽可能多的真实正例。

注算法会为每个目标分配一个置信度

对于二分类器我的理解是即便是有多个目标因为在P_curve和R_curve中每一类都有一条自己对应的曲线所以在计算每一类的时候(比如鱼) 鱼就是正例其余的不管有多少类通通归为负例。

7.PR_curve(精确率和召回率的关系图)

mAP (Mean Average Precision) 即均值平均精度。

mAP是所有类别AP的均值 AP由精确率和召回率确定而IoU 阈值、confidence(置信度) 阈值影响精确率和召回率的计算。计算精确率和召回率时需要判断TP、FP、TN、FN

后面的数表示判定iou为正负例的阈值

可以看到精度越高召回率越低。

我们希望我们的网络在准确率很高的前提下尽可能的检测到全部的类别。所以希望我们的曲线接近 1 1 点即希望mAP曲线的面积尽可能接近1。

第一个衡量指标 mAP曲线的面积大小。

8.F1_curve

F1分数 F1-score 是分类问题的一个衡量指标。是精确率和召回率的调和平均数 1是最好 0是最差。

$F_{1}Score \frac{2*Precision*Recall}{Precision Recall}$

9.可视化训练结果解析

横坐标代表的是训练轮数(epoch)

obj(Objectness) 推测为目标检测loss均值越小目标检测越准。

cls(Classification) 推测为分类loss均值越小分类越准。

第二个衡量指标宏观上一般训练结果主要观察精度和召回率波动情况波动不是很大则训练效果较好如果训练比较好的话图上呈现的是稳步上升。

10.小感悟

Q1 在学习YOLOv5训练结果分析的过程中突然有了一个疑问 train.py不就是训练训练图片怎么会涉及到精确率的问题

解释在训练过程中有一步会生成训练集(train.txt)、验证集(val.txt)、测试集(test.txt) 其中存放图片的名字(无后缀.jpg)。

训练集用于训练模型以及确定参数。相当于老师教学生知识的过程。

验证集用于确定网络结构以及调整模型的超参数。相当于月考等小测验用于学生对学习的查漏补缺。

测试集用于检验模型的泛化能力。相当于大考上战场一样真正的去检验学生的学习效果。

所以我感觉正是测试测试集的过程中才出来的精确率、召回率等参数。

关于毕设训练结果文档中P_curve、R_curve都只有黑鲷的原因是测试集里只有黑鲷的图片。

这里设计到训练集、验证集、测试集的比例划分(未解决)

半成品仅仅是为了自己理解YOLOv5的具体原理如有侵权麻烦告知立删

优惠劵

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

更多文章请关注《万象专栏》

转载请注明出处：https://www.wanxiangsucai.com/read/cv182467

话题推荐： ##

打赏
0 赞
收藏
评论
举报

下一篇：四个月内掌握AI快速入门人工智能的关键技能与学习路径

发布评论

全部评论(0)

YOLOv5训练结果分析

YOLOv5训练结果分析

相关文章