深度学习和目标检测系列教程 3-300:了解常见的目标检测的开源数据集
@Author:Runsen
計算機視覺中具有挑戰性的主題之一,對象檢測,可幫助組織借助數字圖片作為輸入來理解和識別實時對象。大量的論文基于常見的目標檢測的開源數據集而來,因此需要了解常見的目標檢測的開源數據集
- https://public.roboflow.com/object-detection
CIFAR-10
CIFAR-10 是一個綜合數據集,由 10 個不同類別的 60,000 張彩色圖像組成。該數據集包含 10,000 張測試圖像和 50,000 張訓練圖像,分為五個訓練組。
點擊下面鏈接了解有關數據集的更多信息 和CIFAR-10/100和 ImageNet 與 PyTorch分類的鏈接。
- http://www.cs.toronto.edu/~kriz/cifar.html
- https://github.com/bearpaw/pytorch-classification
COCO
MS COCO 是一個大規模對象檢測數據集,它解決了場景識別中的三個核心分析問題。檢測對象的非標志性場景(或非規范視角)、對象內的上下文推理以及對象的準確 2D 定位。
該數據集具有特定特征,例如對象分割、情境識別、超像素素材分割、150 萬個對象實例、80 個對象類等。
點擊下面鏈接了解有關數據集的更多信息 和教程的鏈接。
- https://cocodataset.org/#home
- https://cv.gluon.ai/contents.html
LISA 交通標志檢測數據集:
LISA 或智能安全汽車交通標志數據集實驗室是一組包含美國交通標志的帶注釋的幀和視頻。該數據集包括從不同相機收集的圖像、47 種美國標志類型以及 6610 個邊界上的 7855 個注釋。LISA 分兩個階段發布,即一個有照片,一個有視頻和圖片。
點擊下面鏈接了解有關數據集的更多信息 和Kaggle 上 LISA 交通標志檢測代碼討論的鏈接。
- http://cvrr.ucsd.edu/LISA/lisa-traffic-sign-dataset.html
- https://www.kaggle.com/mbornoe/lisa-traffic-light-dataset/code
Open Image
Open Image 是一個包含大約 900 萬張圖片的數據集,這些圖片帶有圖像級標簽、對象邊界框、對象分割掩碼、視覺關系和本地化敘述。
該數據集包括 1600 萬個邊界框,用于 190 萬張圖像上的 600 種對象類型,使其成為當前最重要的具有對象位置注釋的數據集。這些框基本上是由專家注釋者手動勾畫的,以確保效率和一致性。
Open Images 還授予視覺關系注釋,指示相關關系中的對象對、對象屬性和人類活動。
點擊下面鏈接了解有關數據集的更多信息 和基于Google Open Images 數據集的自定義子集構建卷積神經網絡機器學習分類器。
- https://storage.googleapis.com/openimages/web/factsfigures.html
- https://github.com/quiltdata/open-images
ExDark
Exclusively Dark (ExDARK) 是一個獨特的低光圖像數據集,它提供了一組主要的圖像,用于對低光分析工作進行基準測試,并將相互不同的專業領域集中在低光條件下,例如,圖像理解、圖像增強,物體檢測等。
該數據集是 7,363 張低光照片的組合,從極低光條件到黃昏(即十個不同狀態),12 個對象類別(與 PASCAL VOC 相關)在圖像分類級別和局部目標是邊界框上進行注釋。
點擊下面鏈接了解有關數據集的更多信息 和使用 TensorFlow 的對象檢測 API 實現了 Faster R-CNN 模型,以識別從 ExDark 數據集獲取的圖像中的對象
- https://github.com/cs-chan/Exclusively-Dark-Image-Dataset
- https://github.com/hmshreyas7/low-light-detection
DOTA
DOTA 是用于航空視覺中物體檢測的海量數據集。可以練習開發和估計航拍照片中的物體檢測器。圖片是從各種傳感器和階段收集的。每張印刷品的尺寸從 800 × 800 到 20,000 × 20,000 像素不等,包括呈現各種比例、方向和圖案的對象。
點擊下面鏈接了解有關數據集的更多信息 和在 DOTA 上訓練的模型代碼庫的鏈接。
- https://hyper.ai/datasets/4920
BDD100K
BDD100K 是獨立多任務學習的驅動數據集。該數據集包含 10 個任務和 10 萬個視頻,用于估計自動駕駛圖像識別算法的進展。
該數據集上的功能包括多目標分割跟蹤、圖像標記、道路目標檢測、語義分割、車道檢測、可行駛區域分割、實例分割、多目標檢測跟蹤、域采用和模仿訓練。
點擊下面鏈接了解有關數據集的更多信息通過提出FCN+LSTM 模型
- https://github.com/bdd100k/bdd100k
- https://github.com/gy20073/BDD_Driving_Model
VOC
PASCAL VOC為圖像識別和分類提供了一整套標準化的優秀的數據集,這是一個監督學習的問題,訓練集以帶標簽的圖片的形式給出。這些物體包括20類
Pascal VOC網址:
http://host.robots.ox.ac.uk/pascal/VOC/
查看各位大牛算法的排名的Leaderboards:http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.php
訓練/驗證數據集下載(2G):host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
ImageNet
ImageNet是一個計算機視覺系統識別項目,是目前世界上圖像識別最大的數據庫。
大約1500萬張圖片,2.2萬類,每張都經過嚴格的人工篩選與標記。ImageNet類似于圖片所有引擎。
其中,包括邊界框的目標檢測數據集,訓練數據集包括500,000張圖片,屬于200類物體。
ImageNet數據集介紹以及下載鏈接:
http://www.image-net.org/
總結
以上是生活随笔為你收集整理的深度学习和目标检测系列教程 3-300:了解常见的目标检测的开源数据集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习和目标检测系列教程 2-300:
- 下一篇: 王国之泪五连发的弓是哪只人马