pascal行人voc_Pascal Voc数据集详细分析
前言
做深度學習目標檢測方面的同學怎么都會接觸到PASCAL VOC這個數據集。也許很少用到整個數據集,但是一般都會按照它的格式準備自己的數據集。所以這里就來詳細的記錄一下PASCAL VOC的格式,包括目錄構成以及各個文件夾的內容格式,方便以后自己按照VOC的標準格式制作自己的數據集。
正文
相關網址
VOCdevkit文件夾
數據集下載后解壓得到一個名為VOCdevkit的文件夾,該文件夾結構如下:.└──?VOCdevkit????└──?VOC2012????????├──?Annotations????????├──?ImageSets????????│???├──?Action????????│???├──?Layout????????│???├──?Main????????│???└──?Segmentation????????├──?JPEGImages????????├──?SegmentationClass????????└──?SegmentationObject123456789101112
這里大概介紹一下各個文件夾的內容,更細節的介紹將在后文給出:
- Annotation文件夾存放的是xml文件,該文件是對圖片的解釋,每張圖片都對于一個同名的xml文件。
- ImageSets文件夾存放的是txt文件,這些txt將數據集的圖片分成了各種集合。如Main下的train.txt中記錄的是用于訓練的圖片集合
- JPEGImages文件夾存放的是數據集的原圖片
- SegmentationClass以及SegmentationObject文件夾存放的都是圖片,且都是圖像分割結果圖(樓主沒用過,所以不清楚)
Annotation文件夾
Annotation文件夾的內容如下:
其中xml主要介紹了對應圖片的基本信息,如來自那個文件夾、文件名、來源、圖像尺寸以及圖像中包含哪些目標以及目標的信息等等,內容如下:
VOC2012
2007_000027.jpg
The?VOC2007?Database
PASCAL?VOC2007
flickr
486
500
3
0
person
Unspecified
0
0
174
101
349
351
head
169
104
209
146
hand
278
210
297
233
foot
273
333
297
354
foot
319
307
340
326
ImageSets文件夾
ImageSets包含如下四個子文件夾:
各個文件夾中存放的是各種用途的TXT文件。例如在Main文件夾下有名為aeroplane_train.txt的文件,顧名思義是用于飛機類別的訓練數據。該txt的具體內容如下,其中±1應該表示的是正負樣本的含義(沒有具體研究):2008_000008?-1
2008_000015?-1
2008_000019?-1
2008_000023?-1
2008_000028?-1
2008_000033??1
2008_000036?-1
2008_000037??1
2008_000041?-1
2008_000045?-1
其中包含的train.txt以及trainval.txt等文件內容與上面類似。不過博主發現train.txt和trainval.txt內容中光有圖片的名字,末尾沒有標注正負1.
JEPGImages文件夾
該文件夾存放的是數據集的所有源圖片,內容如下:
SegmentationClass文件夾
還沒有涉及圖像分割領域,不太清楚該文件夾下圖片的用處,截圖貼上來吧:
SegmentationObject文件夾
同上,把內容截圖上傳:
總結
以上是生活随笔為你收集整理的pascal行人voc_Pascal Voc数据集详细分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: QSS 介绍
- 下一篇: STM32 汇编程序——串口输出 Hel