PASCAL VOC2012数据集分析
PASCAL VOC2012數(shù)據(jù)集分析
- 一、簡(jiǎn)介
- 二、PASCAL VOC2012數(shù)據(jù)集
- 三、參考資料
Pascal VOC2012官網(wǎng)地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
PASCAL VOC論文:http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham15.pdf
一、簡(jiǎn)介
PASCAL VOC挑戰(zhàn)賽 (The PASCAL Visual Object Classes Challenge)是關(guān)于計(jì)算機(jī)視覺(jué)的挑戰(zhàn)賽,PASCAL VOC挑戰(zhàn)賽主要包括以下幾類(lèi):分類(lèi)(Classification),檢測(cè)(Detection),分割(Segmentation),行為識(shí)別(Action Classification) 等。
- 圖像分類(lèi)與檢測(cè)
分類(lèi):在測(cè)試圖像預(yù)測(cè)是否為二十個(gè)分類(lèi)之一,正確分類(lèi)。
檢測(cè):在測(cè)試圖像上預(yù)測(cè)二十個(gè)分類(lèi)對(duì)象的有無(wú)與位置信息。
- 圖像分割
分割:圖像分割一般包括實(shí)例分割和語(yǔ)義分割,實(shí)例分割是要把每個(gè)單獨(dú)的目標(biāo)用一種顏色表示(如下圖中間的圖像),而語(yǔ)義分割只是把同一類(lèi)別的所有目標(biāo)用同一顏色表示(如下圖右側(cè)的圖片)。
- 行為識(shí)別
行為識(shí)別:預(yù)測(cè)圖像中人的行為動(dòng)作
- Person Layout標(biāo)注
Person Layout標(biāo)注:檢測(cè)人與其各個(gè)身體組成部分,如果手、腳、頭等。
二、PASCAL VOC2012數(shù)據(jù)集
Pascal VOC2012數(shù)據(jù)集主要是針對(duì)視覺(jué)任務(wù)中監(jiān)督學(xué)習(xí)提供標(biāo)簽數(shù)據(jù),它有二十個(gè)類(lèi)別:
Person:person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle:aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
下載路徑: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html#devkit
下載完之后解壓文件,打開(kāi)VOCdevkit-VOC2012可以看到如下文件。
Annotations文件夾
Annotations文件夾中存放的是xml格式的標(biāo)簽文件,每一個(gè)xml文件都對(duì)應(yīng)于JPEGImages文件夾中的一張圖片,一共有17125個(gè)項(xiàng)目文件。
xml文件具體格式如下圖所示,
對(duì)應(yīng)圖片如下所示,
ImageSets文件夾
ImageSets存放的是每一種類(lèi)型的challenge對(duì)應(yīng)的圖像數(shù)據(jù)。
在ImageSets下有四個(gè)文件夾:
- Action文件夾下面存放的是人的行為動(dòng)作圖像信息,比如running,jumping等。
- Layout文件夾存放的是人的各個(gè)部位圖像信息,比如head,hand,feet等。
- Main文件夾存放的是目標(biāo)檢測(cè)分類(lèi)圖像信息,總共分為20類(lèi),包含了20個(gè)分類(lèi)的***_train.txt、***_val.txt和***_trainval.txt文件。
- ***_train.txt文件表示訓(xùn)練集
- ***_val.txt文件表示驗(yàn)證集
- ***_trainval.txt文件表示訓(xùn)練集+驗(yàn)證集
這些txt文件中格式為:圖像文件名 + 空格 + 標(biāo)記,以aeroplane_tran.txt文件為例:
其中:
- 1 表示圖像中包含aeroplane
- -1 表示圖像中不包含aeroplane
Pascal VOC2012 Main文件中統(tǒng)計(jì)的訓(xùn)練、驗(yàn)證、驗(yàn)證與訓(xùn)練圖像如下:
- Segmentation 文件夾存放的是目標(biāo)分割圖像信息,包含了train.txt(訓(xùn)練集1464個(gè))、val.txt(驗(yàn)證集1449個(gè))、trainval.txt(訓(xùn)練集+驗(yàn)證集2913個(gè))。
JPEGImages文件夾
存放所有的原始圖像文件,格式必須是JPG格式,這個(gè)要特別注意!如果你打算使用VOC2012格式生成數(shù)據(jù),那么原始圖像格式在采樣時(shí)候請(qǐng)用JPG格式保存,避免后期生成使用tensorflow工具生成的時(shí)候出錯(cuò)。
SegmentationClass文件夾
存放所有分割的圖像標(biāo)注,分割圖像按照每個(gè)類(lèi)別標(biāo)注的數(shù)據(jù),相當(dāng)于語(yǔ)義分割PNG圖。
SegmentationObject文件夾
存放所有分割的圖像標(biāo)注,分割圖像按照每個(gè)類(lèi)別每個(gè)對(duì)象不同標(biāo)注的數(shù)據(jù),相當(dāng)于實(shí)例分割PNG圖。
三、參考資料
PASCAL VOC2012數(shù)據(jù)集介紹
PASCAL VOC2012 數(shù)據(jù)集詳解
總結(jié)
以上是生活随笔為你收集整理的PASCAL VOC2012数据集分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python vecm_用Eviews处
- 下一篇: 批量修改已下载的图片格式