比赛分享！科大讯飞动作识别算法赛初赛baseline

2023-03-01 17:27 作者:深度之眼官方账号 0人读过 | 我要投稿

最终: 0.76757分

比赛网址:

http://challenge.xfyun.cn/topic/info?type=action-recognition&ch=ds22-dw-zmt05

带标注的训练数据，即视频中的每一帧都有动作标签；不带标注的测试数据。

作品介绍视频要求：视频数据按照数据来源存放在不同的文件夹中，视频文件采用H.264编码的mp4格式；标签文件对应视频文件放在同一文件夹下，标签文件采用txt格式，每一行标明帧号和本帧的人物动作label。

模型预测结果采用准确率（accuarcy）进行评价，对于模型预测的结果，严格对比每一帧预测结果与真实标注的要素名和要素内容，若二者完全一致，则记为本帧识别正确。

对于一段测试视频计算准确率的方法为： accuracy=本段视频中完全预测正确的要素个数/本段视频的帧数。

对于一个模型计算准确率的方法为：accuracy=累加每段视频预测的准确率/总的测试视频个数。

赛题需要对视频的图像内容进行识别，因此可以考虑抽象为图像分类任务。完成赛题的步骤为：

baseline代码是在恒源云平台上运行的

由于赛题是按照帧标注的数据，因此我们抽帧可以直接选择所有的帧，并进行保存为图像。

我尝试了一下，resnet和efficientnet系列效果比较好，swin_transformer系列效果不太好而且模型太大保存不方便

关注【学姐带你玩AI】公众号

后台回复“ 比赛”

获取190多场比赛top方案，天池、kaggle、ccf等等都有哦！

标签：比赛算法科大讯飞动作识别