深度学习常用数据集资源(计算机视觉领域)
目錄
1、MNIST?
2、ImageNet?
4、COCO?
5、PASCAL VOC
6、FDDB
1、MNIST?
深度學(xué)習領(lǐng)域的入門數(shù)據(jù)集,當前主流的深度學(xué)習框架幾乎都將MNIST數(shù)據(jù)集的處理入門第一教程。MNIST是一個手寫數(shù)字數(shù)據(jù)庫,它有60000個訓(xùn)練樣本集和10000個測試樣本集,每個樣本圖像的寬高為28*28,數(shù)字放在一個歸一化的、固定尺寸的圖片的中心。
數(shù)據(jù)集大小:~12MB
下載地址:http://yann.lecun.com/exdb/mnist/index.html
2、ImageNet?
Imagenet數(shù)據(jù)集是目前深度學(xué)習圖像領(lǐng)域應(yīng)用得非常多的一個領(lǐng)域,關(guān)于圖像分類、定位、檢測等研究工作大多基于此數(shù)據(jù)集展開。Imagenet數(shù)據(jù)集文檔詳細,有專門的團隊維護,使用非常方便,在計算機視覺領(lǐng)域研究論文中應(yīng)用非常廣,幾乎成為了目前深度學(xué)習圖像領(lǐng)域算法性能檢驗的“標準”數(shù)據(jù)集。
Imagenet數(shù)據(jù)集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標注和圖像中物體位置的標注。
數(shù)據(jù)集大小:~1TB
下載地址:http://www.image-net.org/about-stats
CIFAR-10包含10個類別,50,000個訓(xùn)練圖像,彩色圖像大小:32x32,10,000個測試圖像。CIFAR-100則是包含100個類,每類有600張圖片,其中500張用于訓(xùn)練,100張用于測試;這100個類分組成20個超類。圖像類別均有明確標注。CIFAR對于圖像分類算法測試來說是一個非常不錯的中小規(guī)模數(shù)據(jù)集,雖然用得人比以前少了很多,但仍然能用它做有趣的合理性測試。
數(shù)據(jù)集大小:~170MB
下載地址:http://www.cs.toronto.edu/~kriz/cifar.html
4、COCO?
COCO數(shù)據(jù)集由微軟贊助,其對于圖像的標注信息不僅有類別、位置信息,還有對圖像的語義文本描述,COCO數(shù)據(jù)集的開源使得近兩三年來圖像分割語義理解取得了巨大的進展,也幾乎成為了圖像語義理解算法性能評價的“標準”數(shù)據(jù)集。
數(shù)據(jù)集大小:~40GB
下載地址:http://mscoco.org/?
5、PASCAL VOC
PASCAL VOC圖片集包括20個目錄:人類;動物(鳥、貓、牛、狗、馬、羊);交通工具(飛機、自行車、船、公共汽車、小轎車、摩托車、火車);室內(nèi)(瓶子、椅子、餐桌、盆栽植物、沙發(fā)、電視)。PASCAL VOC挑戰(zhàn)賽是視覺對象的分類識別和檢測的一個基準測試,提供了檢測算法和學(xué)習性能的標準圖像注釋數(shù)據(jù)集和標準的評估系統(tǒng)。
數(shù)據(jù)集大小:~2GB
下載地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html
6、FDDB
FDDB是全世界最具權(quán)威的人臉檢測評測平臺之一,包含2845張圖片,共有5171個人臉作為測試集。測試集范圍包括:不同姿勢、不同分辨率、旋轉(zhuǎn)和遮擋等圖片,同時包括灰度圖和彩色圖,標準的人臉標注區(qū)域為橢圓形。該數(shù)據(jù)集的圖片來自于美聯(lián)社和路透社新聞報道圖片,并刪除了重復(fù)圖片。
數(shù)據(jù)集大小:~550MB
下載地址:http://vis-www.cs.umass.edu/fddb/
總結(jié)
以上是生活随笔為你收集整理的深度学习常用数据集资源(计算机视觉领域)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ZigBee(CC2530)最小系统PC
- 下一篇: Python+OpenCV创建级联文件(