欢迎光临散文网 会员登陆 & 注册

学习笔记-YOLOv5运行结果文件认识初探

2023-03-23 17:05 作者:Erromana  | 我要投稿

内容主要来源:https://blog.csdn.net/qq_42784882/article/details/127386465

当我们的yolov5跑完数据集后,会反馈给我们很多文件,如上图所示。

前置概念:

基础概念:

几个指标:

weights:

此文件夹存放训练过程最好的和最后一此迭代训练得到的权重:best.pt和last.pt

confusion混淆矩阵:

左侧为预测类,下方为目标真实类,从下方上看。比如,此次训练,time目标被被训练得到的模型识别为time的比例为1,即被百分百识别。而have目标识别have的比例0.8左右,另有0.2比例被识别为tea。同理,name目标被错误识别为people的比例为0.2左右。

labels.jpg:

左上为每个类别的数量。右上为框的尺寸和数量。

左下为框的中心点坐标。右下为框的长度和宽度。

对应的许是训练集的数据内容,不知道有没有验证集,这一点和具体怎么度量就以后再说吧。

P_curve:

p曲线,即precision精确率曲线。下方的confidence按照我在吴恩达机器学习中学到的内容,理解为模型求解图片后,对于图片 存在/是 某一类别的对象,给出的可能性、置信度。我们可以设置图片置信度的阈值,判断置信度大于该阈值的图片属于该类别,得到模型对该图片的最终判断,即是某物。那么图片就好理解了,即置信度阈值越高,模型才认为图片是该物品,模型判断的越准确,这是很自然的,无需解释。但置信度阈值过高,可能会导致掉那些忽略信度低,但确实有该物品的图像。

蓝线是全体类别判断精度,灰线则是其余具体的类的精准率_置信度曲线。

R_curve:

Recall/召回率/查全率曲线。Recall即上面公式图中的TPR对应的Sensitivity:真实值是yes(positive或称正例,即有要检测的类别的单个图片样本)的样本的预测结果正确的比例,正例预测正确的比例。即正例查全的比例。显然,置信度月底,查全率会越高,即不容易漏过有对象的图片。

蓝线,灰线同上。

PR_curve:

精确度和召回率的关系曲线。毫无疑问,我们希望R越低越好,P越高越好,但这是矛盾的,前者需要置信度阈值降低,后者需要置信度阈值增高,它们是一对矛盾的性能度量指标。

于是有了PR_curve,精确度和召回率曲线,此处的P为mAP(mean Average Precision),即平均精度,

毫无疑问,我们希望P与R都能到1,即曲线围成最大的正方框,面积接近1。

F1_curve

F1(F1-score)曲线。F1=2*P*R/(P+R),是P与R的调和平均数,我认为是一种对P与R的综合度量。1最好,0最差。

引用第一个衡量指标:mAP曲线的面积大小。

result:

横坐标为轮数(epoch),纵坐标为各类损失,越小,效果越好些。个人认为box为预测标框与标注标框偏差,obj是图片有无识别出对象偏差,cls为对象分类偏差。

引用第二个衡量指标:“宏观上一般训练结果主要观察精度召回率波动情况,波动不是很大则训练效果较好;如果训练比较好的话图上呈现的是稳步上升。”


ok,认识完毕了,开始观察自己的训练结果,研究训练方向吧。


学习笔记-YOLOv5运行结果文件认识初探的评论 (共 条)

分享到微博请遵守国家法律