学习笔记-YOLOv5运行结果文件认识初探

2023-03-23 17:05 作者:Erromana 0人读过 | 我要投稿

内容主要来源：https://blog.csdn.net/qq_42784882/article/details/127386465

当我们的yolov5跑完数据集后，会反馈给我们很多文件，如上图所示。

前置概念：

基础概念：

几个指标：

weights：

此文件夹存放训练过程最好的和最后一此迭代训练得到的权重：best.pt和last.pt

confusion混淆矩阵：

左侧为预测类，下方为目标真实类，从下方上看。比如，此次训练，time目标被被训练得到的模型识别为time的比例为1，即被百分百识别。而have目标识别have的比例0.8左右，另有0.2比例被识别为tea。同理，name目标被错误识别为people的比例为0.2左右。

labels.jpg：

左上为每个类别的数量。右上为框的尺寸和数量。

左下为框的中心点坐标。右下为框的长度和宽度。

对应的许是训练集的数据内容，不知道有没有验证集，这一点和具体怎么度量就以后再说吧。

P_curve：

p曲线，即precision精确率曲线。下方的confidence按照我在吴恩达机器学习中学到的内容，理解为模型求解图片后，对于图片存在/是某一类别的对象，给出的可能性、置信度。我们可以设置图片置信度的阈值，判断置信度大于该阈值的图片属于该类别，得到模型对该图片的最终判断，即是某物。那么图片就好理解了，即置信度阈值越高，模型才认为图片是该物品，模型判断的越准确，这是很自然的，无需解释。但置信度阈值过高，可能会导致掉那些忽略信度低，但确实有该物品的图像。

蓝线是全体类别判断精度，灰线则是其余具体的类的精准率_置信度曲线。

R_curve：

Recall/召回率/查全率曲线。Recall即上面公式图中的TPR对应的Sensitivity：真实值是yes（positive或称正例，即有要检测的类别的单个图片样本）的样本的预测结果正确的比例，正例预测正确的比例。即正例查全的比例。显然，置信度月底，查全率会越高，即不容易漏过有对象的图片。

蓝线，灰线同上。

PR_curve：

精确度和召回率的关系曲线。毫无疑问，我们希望R越低越好，P越高越好，但这是矛盾的，前者需要置信度阈值降低，后者需要置信度阈值增高，它们是一对矛盾的性能度量指标。

于是有了PR_curve，精确度和召回率曲线，此处的P为mAP（mean Average Precision）,即平均精度，

毫无疑问，我们希望P与R都能到1，即曲线围成最大的正方框，面积接近1。

F1_curve

F1（F1-score）曲线。F1=2*P*R/(P+R)，是P与R的调和平均数，我认为是一种对P与R的综合度量。1最好，0最差。

引用第一个衡量指标：mAP曲线的面积大小。

result：

横坐标为轮数（epoch），纵坐标为各类损失，越小，效果越好些。个人认为box为预测标框与标注标框偏差，obj是图片有无识别出对象偏差，cls为对象分类偏差。

引用第二个衡量指标：“宏观上一般训练结果主要观察精度和召回率波动情况，波动不是很大则训练效果较好；如果训练比较好的话图上呈现的是稳步上升。”

ok，认识完毕了，开始观察自己的训练结果，研究训练方向吧。

标签：人工智能 yolov5