目标检测数据集MSCOCO简介
簡介
?
介紹一下目標檢測領域另外一個比較有名的數據集?MS COCO?(Microsoft COCO: Common Objects in Context) .
MSCOCO 數據集是微軟構建的一個數據集,其包含 detection, segmentation, keypoints等任務。
MSCOCO主要是為了解決detecting non-iconic views of objects(對應常說的detection), contextual reasoning between objects and the precise 2D localization of objects(對應常說的分割問題) 這三種場景下的問題。
下面是iconic 圖片和 non-iconic 圖片之間的對比。
與PASCAL COCO數據集相比,COCO中的圖片包含了自然圖片以及生活中常見的目標圖片,背景比較復雜,目標數量比較多,目標尺寸更小,因此COCO數據集上的任務更難,對于檢測任務來說,現在衡量一個模型好壞的標準更加傾向于使用COCO數據集上的檢測結果。
數據集的構建過程不說了。主要關注一下統計信息
1 統計信息
MSCOCO總共包含91個類別,每個類別的圖片數量如下:
- 圖中也標出了PASCAL VOC的統計數據作為對比。
下圖展示的是幾個不同數據集的總類別數量,以及每個類別的總實例數量,一個實例就是圖片上的一個目標,主要關注一下 PASCAL 和 ImageNet。
- COCO數據集的類別總數雖然沒有 ImageNet 中用于detection的類別總數多,但是每個類別的實例目標總數要比PASCAL和ImageNet都要多。
下圖是每張圖片上的類別數量或者實例數量的分布,括號中為平均值
-
PASCAL和ImageNet中,每張圖片上的類別或者實例數量普遍都很少。
以PASCAL為例:有多于70%的圖片上都只有一個類別,而多于50%的圖片上只有一個實例或者目標。PASCAL數據集平均每張圖片包含1.4個類別和2.3個實例目標,ImageNet也僅有1.7和3.0個。
-
COCO數據集平均每張圖片包含 3.5個類別和 7.7 個實例目標,僅有不到20%的圖片只包含一個類別,僅有10%的圖片包含一個實例目標。
-
COCO數據集不僅數據量大,種類和實例數量也多。從這角度來說 SUN 數據集這兩個指標更高一點,但是這個數據集在目標檢測里面并不常用。
實例目標的分布
?
- COCO數據集中的小目標數量占比更多
關于數據集的劃分,COCO的論文里是這么說的,
The 2014 release contains 82,783 training, 40,504 validation, and 40,775 testing images (approximately 1/2 train, 1/4 val, and /4 test). There are nearly 270k segmented people and a total of 886k segmented object instances in the 2014 train+val data alone. The cumulative 2015 release will contain a total of 165,482 train, 81,208 val, and 81,434 test images.
2014年的數據在官網是可以下載的,但是2015年只有test部分,train和val部分的數據沒有。另外2017年的數據并沒有什么新的圖片,只是將數據重新劃分,train的數據更多了,如下:
2 評估標準
COCO的測試標準比PASCAL VOC更嚴格:
?
-
PASCAL 中在測試mAP時,是在IOU=0.5時測的
-
COCO中的AP 是指在 10個IOU層面 以及 80個類別層面 的平均值
-
COCO的主要評價指標是AP,指 IOU從0.5到0.95 每變化 0.05 就測試一次 AP,然后求這10次測量結果的平均值作為最終的 AP
AP@0.5 跟PASCAL VOC中的mAP是相同的含義
AP@0.75 跟PASCAL VOC中的mAP也相同,只是IOU閾值提高到了0.75,顯然這個層面更嚴格,精度也會更低
IOU越高,AP就越低,所以最終的平均之后的AP要比 AP@0.5 小很多,這也就是為什么COCO的AP 超過 50%的只有寥寥幾個而已,因為超過50%太難了。而且由于COCO數據集本身數據的復雜性,所以目前的 AP@0.5 最高也只有 73% 。
-
COCO數據集還針對 三種不同大小(small,medium,large) 的圖片提出了測量標準,COCO中包含大約 41% 的小目標 (area<32×32area<32×32), 34% 的中等目標 (32×32<area<96×9632×32<area<96×96), 和 24% 的大目標 (area>96×96area>96×96). 小目標的AP是很難提升的。
-
除了AP之外,還提出了 AR 的測量標準 跟AP是類似的。
COCO提供了一些代碼,方便對數據集的使用和模型評估 :https://github.com/cocodataset/cocoapi
3 總結
為什么COCO的檢測任務那么難?
- 圖片大多數來源于生活中,背景更復雜
- 每張圖片上的實例目標個數多,平均每張圖片7.7個
- 小目標更多
- 評估標準更嚴格
所以現在大家更傾向于使用COCO來評估模型的質量。
參考資料
本文標題:目標檢測數據集MSCOCO簡介
本文作者:arleyzhang
發布時間:2018年06月04日 - 03:06
最后更新:2018年11月16日 - 22:11
本文鏈接:目標檢測數據集MSCOCO簡介 | arleyzhang?
版權聲明:?本文由 arleyzhang 原創,采用??保留署名-非商業性使用-禁止演繹 4.0-國際許可協議,轉載請保留原文鏈接及作者!
?dataset
總結
以上是生活随笔為你收集整理的目标检测数据集MSCOCO简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 目标检测数据集PASCAL VOC简介
- 下一篇: 什么类型基金适合定投 选择波动大的最好