行人重识别market1501数据集介绍及格式转化汇总

2023-04-23 10:54 作者:深度之眼官方账号 0人读过 | 我要投稿

来源：投稿作者：AI浩
编辑：学姐

market1501数据集介绍

2015年，论文 Person Re-Identification Meets Image Search 提出了 Market 1501 数据集，现在 Market 1501 数据集已经成为行人重识别领域最常用的数据集之一。

数据库中常见的缺点有：

数据库规模小（图片少）
摄像头个数少（一般为两个）
行人身份较少
每个身份的query只有一个
图片均为手动标记的完美图片，缺乏实际性

针对以上种种问题，创立了Market1501：

1501个身份
6个摄像头
32668张图片
DPM检测器代替手工框出行人
500K张干扰图片
每一个身份有多个query
每一个query平均对应14.8个gallery

Market 1501 的行人图片采集自清华大学校园的 6 个摄像头，一共标注了 1501 个行人。其中，751 个行人标注用于训练集，750 个行人标注用于测试集，训练集和测试集中没有重复的行人 ID，也就是说出现在训练集中的 751 个行人均未出现在测试集中。

训练集：751 个行人，12936 张图片
测试集：750 个行人，19732 张图片
query 集：750 个行人，3368 张图片。query 集的行人图片都是手动标注的图片，从 6 个摄像头中为测试集中的每个行人选取一张图片，构成 query 集。测试集中的每个行人至多有 6 张图片，query 集共有 3368 张图片。

网络模型训练时，会用到训练集；测试模型好坏时，会用到测试集和 query 集。此时测试集也被称作 gallery 集。因此实际用到的子集为，训练集、gallery 集和 query 集。

数据集结构

Market 1501 包括以下几个文件夹：

bounding_box_test 是测试集，包括 19732 张图片。
bounding_box_train 是训练集，包括 12936 张图片。
gt_bbox 是手工标注的训练集和测试集图片，包括 25259 张图片，用来区分 “good” “junk” 和 “distractors” 图片。
query 是待查找的图片集，在 bounding_box_test 中实现查找。这些图片是手动绘制生成的。而 gallery 是通过 DPM 检测器生成的。
gt_query 是一些 Matlab 格式的文件，里面记录了 “good” 和 “junk” 图片的索引，主要被用来评估模型。

数据集命名规则

以图片 0012_c4s1_000826_01.jpg 对数据集命名进行说明。

0012 是行人 ID，Market 1501 有 1501 个行人，故行人 ID 范围为 0001-1501
c4 是摄像头编号(camera 4)，表明图片采集自第4个摄像头，一共有 6 个摄像头
s1 是视频的第一个片段(sequece1)，一个视频包含若干个片段
000826 是视频的第 826 帧图片，表明行人出现在该帧图片中
01 代表第 826 帧图片上的第一个检测框，DPM 检测器可能在一帧图片上生成多个检测框

格式转化

1、创建数据集文件夹

新建1_makedir.py，插入代码：

运行后就可以得到文件夹！

2、抽取market1501数据集

将market1501数据集放到目录，如下图：

新建2_mark1501.py，插入代码：

抽取后的结果：

3、抽取CUHK03数据集

ID从1502开始，一共1467个不同ID的行人

两个数据集的训练集加起来有2万张了图片，测试集有1.8万张图片，接下来就不在增加测试集的数据了。

4、抽取MSMT17数据集

训练集包含1041个行人共32621个包围框，而测试集包括3060个行人共93820个包围框。数据集选择用MSMT17V1（文末领数据集）

导入完成后id增加到了7069。

5、抽取viper数据集

viper数据集一共有1264张图片， ID从007070到007943一共1467个不同ID的行人

新建脚本5_viper.py,插入代码：

导入完成后，id为7943。

6、抽取prid 2011

PRID数据集有摄像机A的385条轨迹和摄像机b的749条轨迹，其中只有200人出现在两个摄像机中。该数据集还有一个单镜头版本，由随机选择的快照组成。有些轨迹没有很好地同步，这意味着人可能会在连续的帧之间“跳跃”。

导入prid2011之后，id为9077

7、抽取i-LIDS-VID数据集

导入i-LIDS-VID数据集后，id为9396

8、抽取GRID数据集

QMUL地下再识别(GRID)数据集包含250个行人图像对。每一对都包含两张从不同视角看到的同一个体的图像。所有的图像都是从安装在一个繁忙的地铁站的8个不相交的摄像头视图中捕捉到的。旁边的图显示了该站的每个相机视图的快照和数据集中的样本图像。由于姿势的变化，颜色，灯光的变化，数据集是具有挑战性的;以及低空间分辨率造成的图像质量差。

新建8_grid.py脚本，插入代码：

共有9646个ID。

9、抽取DukeMTMC-reID数据集

DukeMTMC-reID的数据规模比较大，格式和CUHK03数据集一致。如下图：

收取数据的代码如下：

完成后，ID为16786。

运行FastReid

将制作好的数据集，替换原来的的market1501数据集。然后在market1501.py脚本修改如下代码：

ID改为9646，相机最大是16，所以相机的id<=16。改完之后就可以运行了。

参考文章：

https://blog.csdn.net/songwsx/article/details/102987787

关注【学姐带你玩AI】回复“17”获取完整MSMT17数据集

标签：