PASCAL VOC 2007数据集介绍
PASCAL VOC 2007(Visual Object Classes)数据集最初是由欧洲计算机视觉会议(European Conference on Computer Vision,ECCV)发起的一个项目,主要用于目标检测、图像分类和语义分割任务。
PASCAL VOC 2007数据集一共有9963张图片,其中训练集和验证集5011张,测试集4952张,包含了20个类别。
20个类别如下图:

训练集和验证集5011张图片:

测试集4952张图片:

PASCAL VOC 2007数据集共包含五个文件夹,文件目录如下:

Annotations:存放目标检测任务的标签文件(xml格式),与JPEGImages文件夹中的图片一一对应,如下图;

ImageSets:包括Layout,Main和Segmentation三个文件夹。其中,Layout用于person layout任务,存放的是具有人体部位的数据(如:头、手和脚等);Main用于分类和检测任务,存放的是分类和检测的数据集划分数据;Segmentation下存放用于分割任务的数据;

JPEGImages:存放jpg格式的图片文件,与Annotations文件夹中的标签一一对应,如下图;

SegmentationClass:存放Semantic Segmentation(语义分割)的标签,不同类别用不同颜色标注,即对每个像素点分类,如下图;

SegmentationObject:存放Instance Segmentation(实例分割)的标签,不同个体用不同颜色标注,即目标检测+语义分割,如下图;

注意一:
关于Annotations中的xml标签文件:
filename:文件名;
source:图片来源;
owner:拥有者;
segmented:是否分割;
size属性:
width表示图片的宽度;
height表示图片的高度;
depth表示图片的深度;
object属性:
name表示bbox的类别;
pose:拍摄角度(front,rear,left,right和unspecified);
truncated:目标是否被截断(如延伸到图片外),是否被遮挡(超过15%);
difficult表示bbox识别难度,0—可识别,1—不可识别;
bndbox表示bbox,(xmin,ymin)—左上角坐标,(xmax,ymax)—右下角坐标;
注意二:
关于Main中的文件
用于检测任务(只记录图片名称)


用于分类任务(记录图片名称和正负样本)


其中,+1为正样本,表示图片是person;-1为负样本,表示图片不是person;
例如,"000012"为负样本,表示图片中没有person;"000017"为正样本,表示图片中有person,如下图:

PASCAL VOC 2007训练集和验证集下载:
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
PASCAL VOC 2007测试集下载:
http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar