欢迎光临散文网 会员登陆 & 注册

PASCAL VOC 2007数据集介绍

2023-03-25 22:54 作者:YouOnly_LiveOnce  | 我要投稿

PASCAL VOC 2007(Visual Object Classes)数据集最初是由欧洲计算机视觉会议(European Conference on Computer Vision,ECCV)发起的一个项目,主要用于目标检测、图像分类和语义分割任务。

PASCAL VOC 2007数据集一共有9963张图片,其中训练集和验证集5011张,测试集4952张,包含了20个类别。

20个类别如下图:

训练集和验证集5011张图片:

测试集4952张图片:




PASCAL VOC 2007数据集共包含五个文件夹,文件目录如下:

Annotations:存放目标检测任务的标签文件(xml格式),与JPEGImages文件夹中的图片一一对应,如下图;

ImageSets:包括Layout,Main和Segmentation三个文件夹。其中,Layout用于person layout任务,存放的是具有人体部位的数据(如:头、手和脚等);Main用于分类和检测任务,存放的是分类和检测的数据集划分数据;Segmentation下存放用于分割任务的数据;

JPEGImages:存放jpg格式的图片文件,与Annotations文件夹中的标签一一对应,如下图;

SegmentationClass:存放Semantic Segmentation(语义分割)的标签,不同类别用不同颜色标注,即对每个像素点分类,如下图;

SegmentationObject:存放Instance Segmentation(实例分割)的标签,不同个体用不同颜色标注,即目标检测+语义分割,如下图;



注意一:

关于Annotations中的xml标签文件:

filename:文件名;

source:图片来源;

owner:拥有者;

segmented:是否分割;

size属性:

width表示图片的宽度;

height表示图片的高度;

depth表示图片的深度;

object属性:

name表示bbox的类别;

pose:拍摄角度(front,rear,left,right和unspecified);

truncated:目标是否被截断(如延伸到图片外),是否被遮挡(超过15%);

difficult表示bbox识别难度,0—可识别,1—不可识别;

bndbox表示bbox,(xmin,ymin)—左上角坐标,(xmax,ymax)—右下角坐标;



注意二:

关于Main中的文件

用于检测任务(只记录图片名称)

用于分类任务(记录图片名称和正负样本)

其中,+1为正样本,表示图片是person;-1为负样本,表示图片不是person;

例如,"000012"为负样本,表示图片中没有person;"000017"为正样本,表示图片中有person,如下图:


PASCAL VOC 2007训练集和验证集下载:

http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar

PASCAL VOC 2007测试集下载:

http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar

PASCAL VOC 2007数据集介绍的评论 (共 条)

分享到微博请遵守国家法律