视频动作识别实验结果【表头】
【自用】
衡量一个模型是否轻量,常常使用这三个指标:FPS,GFLOPs,Params(M)
【帧速率 (FPS)】
frames per second,即:每秒帧数,用于衡量模型的实时性能
【FLOPs-计算量】计算量对应我们之前的时间复杂度
FLOPS:注意全大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。
FLOPs:注意s小写,是floating point operations的缩写(s表复数),意指浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。
注意在深度学习中,我们用的是FLOPs,也就是说计算量,即用来衡量算法/模型的复杂度。
【GFLOPs】
1 GFLOPs = 10^9 FLOPs 即:10亿次浮点运算
G floating point operations的缩写(s表复数),即:10亿次浮点运算,用于衡量模型的计算量。
【Params-参数量】参数量对应于我们之前的空间复杂度
指网络模型中需要训练的参数总数,用于衡量模型复杂度。
【推理分辨率 (RES)】
【帧数 (Frames)】

【top-1,top-5】
Top-1 (Accuracy)是指排名第一的类别与实际结果相符的准确率,
而Top-5 (Accuracy)是指排名前五的类别包含实际结果的准确率。
【ACC- Accuracy(准确率)】
准确率表示预测样本中预测正确数占所有样本数的比例,计算公式为:
准确率 = 预测样本中所有被正确分类的样本数 / 所有的样本数
【P-precision(精确率)】
精确率表示预测样本中实际正样本数占所有正样本数的比例,计算公式为:
精确率 = 正确预测样本中实际正样本数 / 所有的正样本数
【R-recall(召回率)】
召回率表示预测样本中实际正样本数占所有预测的样本的比例,计算公式为:
召回率 = 正确预测样本中实际正样本数 /实际的正样本数
Precision 和 Recall最早是信息检索中的概念,用来评价一个信息检索系统的优劣。Precision 就是检索出来的条目中(比如:文档、网页等)有多大比例是我们需要的,Recall就是所有我们需要的网页的条目有多大比例被检索出来了。
用到目标检测领域,假设我们有一组图片,里面有若干待检测的目标,Precision就代表我们模型检测出来的目标有多大比例是真正的目标物体,Recall就代表所有真实的目标有多大比例被我们的模型检测出来了。
【AP、mAP】
AP:AP 代表 Average Precision,即平均精确度。
mAP:代表Mean Average Precision,即 均值平均精度。
mAP = 所有类别的平均精度求和除以所有类别。
AP衡量一个类别的检测好坏,mAP则是衡量多个类别检测的好坏。把所有类的AP值取平均即可得mAP。比如有两类,类A的AP值是0.5,类B的AP值是0.2,那么:
mAP=(0.5 + 0.2)/ 2=0.35

【目标检测模型的评价指标-IoU:ntersection over union】
交并比IoU衡量的是两个区域的重叠程度(检测物体实际所占区域与检测结果中框出的区域),是两个区域重叠部分面积占二者总面积(重叠部分只计算一次)的比例。
在目标检测任务中,如果我们模型输出的矩形框与我们人工标注的矩形框的IoU值大于某个阈值时(通常为0.5)即认为我们的模型输出了正确的。