欢迎光临散文网会员登陆 & 注册

PASCAL VOC 2007数据集介绍

2023-03-25 22:54 作者:YouOnly_LiveOnce 0人读过 | 我要投稿

PASCAL VOC 2007（Visual Object Classes）数据集最初是由欧洲计算机视觉会议(European Conference on Computer Vision，ECCV)发起的一个项目，主要用于目标检测、图像分类和语义分割任务。

PASCAL VOC 2007数据集一共有9963张图片，其中训练集和验证集5011张，测试集4952张，包含了20个类别。

20个类别如下图：

训练集和验证集5011张图片：

测试集4952张图片：

PASCAL VOC 2007数据集共包含五个文件夹，文件目录如下：

Annotations：存放目标检测任务的标签文件(xml格式)，与JPEGImages文件夹中的图片一一对应，如下图；

ImageSets：包括Layout，Main和Segmentation三个文件夹。其中，Layout用于person layout任务，存放的是具有人体部位的数据(如：头、手和脚等)；Main用于分类和检测任务，存放的是分类和检测的数据集划分数据；Segmentation下存放用于分割任务的数据；

JPEGImages：存放jpg格式的图片文件，与Annotations文件夹中的标签一一对应，如下图；

SegmentationClass：存放Semantic Segmentation(语义分割)的标签，不同类别用不同颜色标注，即对每个像素点分类，如下图；

SegmentationObject：存放Instance Segmentation(实例分割)的标签，不同个体用不同颜色标注，即目标检测+语义分割，如下图；

注意一：

关于Annotations中的xml标签文件：

filename：文件名；

source：图片来源；

owner：拥有者；

segmented：是否分割；

size属性：

width表示图片的宽度；

height表示图片的高度；

depth表示图片的深度；

object属性：

name表示bbox的类别；

pose：拍摄角度(front，rear，left，right和unspecified)；

truncated：目标是否被截断(如延伸到图片外)，是否被遮挡(超过15%)；

difficult表示bbox识别难度，0—可识别，1—不可识别；

bndbox表示bbox，(xmin，ymin)—左上角坐标，(xmax,ymax)—右下角坐标；

注意二：

关于Main中的文件

用于检测任务(只记录图片名称)

用于分类任务(记录图片名称和正负样本)

其中，+1为正样本，表示图片是person；-1为负样本，表示图片不是person；

例如，"000012"为负样本，表示图片中没有person；"000017"为正样本，表示图片中有person，如下图：

PASCAL VOC 2007训练集和验证集下载：

http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar

PASCAL VOC 2007测试集下载：

http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar

标签：目标检测 PASCAL VOC 计算机视觉深度学习数据集

PASCAL VOC 2007数据集介绍的评论 (共条)