比赛分享!科大讯飞动作识别算法赛初赛baseline
最终: 0.76757分
比赛网址:
http://challenge.xfyun.cn/topic/info?type=action-recognition&ch=ds22-dw-zmt05
赛题任务:
带标注的训练数据,即视频中的每一帧都有动作标签;不带标注的测试数据。
作品介绍视频要求:视频数据按照数据来源存放在不同的文件夹中,视频文件采用H.264编码的mp4格式;标签文件对应视频文件放在同一文件夹下,标签文件采用txt格式,每一行标明帧号和本帧的人物动作label。

评价指标:
模型预测结果采用准确率(accuarcy)进行评价,对于模型预测的结果,严格对比每一帧预测结果与真实标注的要素名和要素内容,若二者完全一致,则记为本帧识别正确。
对于一段测试视频计算准确率的方法为: accuracy=本段视频中完全预测正确的要素个数/本段视频的帧数。
对于一个模型计算准确率的方法为:accuracy=累加每段视频预测的准确率/总的测试视频个数。
赛题需要对视频的图像内容进行识别,因此可以考虑抽象为图像分类任务。完成赛题的步骤为:
(1)视频抽帧
(2)构建分类数据集
(3)训练分类模型
(4)对测试集进行预测
baseline代码是在恒源云平台上运行的
(1)训练集和测试集抽帧
由于赛题是按照帧标注的数据,因此我们抽帧可以直接选择所有的帧,并进行保存为图像。
(2)构建分类数据集
(3)训练分类模型
我尝试了一下,resnet和efficientnet系列效果比较好,swin_transformer系列效果不太好而且模型太大保存不方便
(4)对测试集进行预测
关注【学姐带你玩AI】公众号
后台回复“ 比赛”
获取190多场比赛top方案,天池、kaggle、ccf等等都有哦!