欢迎光临散文网 会员登陆 & 注册

比赛分享!科大讯飞动作识别算法赛初赛baseline

2023-03-01 17:27 作者:深度之眼官方账号  | 我要投稿

最终: 0.76757分

比赛网址:

http://challenge.xfyun.cn/topic/info?type=action-recognition&ch=ds22-dw-zmt05

赛题任务:

带标注的训练数据,即视频中的每一帧都有动作标签;不带标注的测试数据。

作品介绍视频要求:视频数据按照数据来源存放在不同的文件夹中,视频文件采用H.264编码的mp4格式;标签文件对应视频文件放在同一文件夹下,标签文件采用txt格式,每一行标明帧号和本帧的人物动作label。

评价指标:

模型预测结果采用准确率(accuarcy)进行评价,对于模型预测的结果,严格对比每一帧预测结果与真实标注的要素名和要素内容,若二者完全一致,则记为本帧识别正确。

对于一段测试视频计算准确率的方法为: accuracy=本段视频中完全预测正确的要素个数/本段视频的帧数。

对于一个模型计算准确率的方法为:accuracy=累加每段视频预测的准确率/总的测试视频个数。

赛题需要对视频的图像内容进行识别,因此可以考虑抽象为图像分类任务。完成赛题的步骤为:

  • (1)视频抽帧

  • (2)构建分类数据集

  • (3)训练分类模型

  • (4)对测试集进行预测

baseline代码是在恒源云平台上运行的

(1)训练集和测试集抽帧

由于赛题是按照帧标注的数据,因此我们抽帧可以直接选择所有的帧,并进行保存为图像。

(2)构建分类数据集

(3)训练分类模型

我尝试了一下,resnet和efficientnet系列效果比较好,swin_transformer系列效果不太好而且模型太大保存不方便

(4)对测试集进行预测

关注【学姐带你玩AI】公众号

后台回复“ 比赛

获取190多场比赛top方案,天池、kaggle、ccf等等都有哦!

比赛分享!科大讯飞动作识别算法赛初赛baseline的评论 (共 条)

分享到微博请遵守国家法律