目前开源数据集整理
Attention!
我的Dr.Sure項目正式上線了,主旨在分享學習Tensorflow以及DeepLearning中的一些想法。期間隨時更新我的論文心得以及想法。
Github地址:https://github.com/wangqingbaidu/Dr.Sure
CSDN地址:http://blog.csdn.net/wangqingbaidu
個人博客地址:http://www.wangqingbaidu.cn/
Images Analysis
| Flickr30k | 圖片描述 | 31,783 images,每張圖片5個語句標注 | 鏈接 |
| Microsoft COCO | 圖片描述 | 330,000 images,每張圖片至少5個語句標注 | 鏈接 |
| ESP Game | 多標簽定義圖像 | 20,770 images,268 tags,諸如bed, light man,music | 鏈接 |
| IAPRTC-12 | 多標簽定義圖像 | 19,452 images,291 tags | 鏈接 |
| NUS-WIDE | 多標簽定義圖像 | 269,648 images,several tags (2-5 on average) per image | 鏈接 |
| CUHK-PEDES | 以文搜圖 | 34,054 images,每張圖片2條描述 | 鏈接 |
| VRD | 視覺關系檢測 | 5,000 images, 100目錄,37,993對關系 | 鏈接 |
| sVG | 視覺關系檢測 | 108,000 images, 998,000對關系 | 鏈接 |
| Visual Genome Dataset | 圖像屬性檢測 | 108,077 images, 5.4 M 區域塊,2.8 M 屬性,2.3 M 關系 | 鏈接 |
| VQA | 問答系統 | 1,105,904問題,11,059,040 回答 | 鏈接 |
| Visual7W | 問答系統 | 327,939 問答對 | 鏈接 |
| TID2013 | 圖像質量評價 | 25張參考圖像,24個失真類型 | 鏈接 |
| CSIQ | 圖像質量評價 | 30張參考圖像,6個失真類型 | 鏈接 |
| LIVE | 圖像質量評價 | 29張參考圖像,5個失真類型 | 鏈接 |
| WATERLOO | 圖像質量評價 | 4744張參考圖像,20個失真類型 | 鏈接 |
| photo.net | 圖像美觀評價 | 20,278張圖像,打分[0,10] | 鏈接 |
| DPChallenge.com | 圖像美觀評價 | 16,509張圖像,打分[0,10] | 鏈接 |
| CUHK | 圖像美觀評價 | 28,410張圖像,只分高質量和低質量 | 鏈接 |
| AVA | 圖像美觀評價 | 255,500張圖像,打分[0,10] | 鏈接 |
Image Motion & Tracking
| CUHK03 | Person re-identification(人重識別) | image num:13164 person num:1360 camera num:10( 5 pairs) | 鏈接 |
| CUHK02 | Person re-identification(人重識別) | image num:7264 person num:1816 camera num:10( 5 pairs) | 鏈接 |
| CUHK01 | Person re-identification(人重識別) | image num:3884 person num:971 camera num: 2 | 鏈接 |
| VIPeR | Person re-identification(人重識別) | image num:1264 person num:632 camera num:2 | 鏈接 |
| ETH1,2,3 | Person re-identification(人重識別) | image num:8580 person num:83,35,28 camera num:1 | 鏈接 |
| PRID2011 | Person re-identification(人重識別) | image num:24541 person num:934 camera num:2 | 鏈接 |
| MARS | Person re-identification(人重識別) | image num:11910031 person num:1261 camera num:6 | 鏈接 |
| Market1501 | Person re-identification(人重識別) | image num:32217 person num:1501 camera num:6 | 鏈接 |
| Epic Fail (EF) dataset | Risk Assessment(風險評估) | video num:3000 | 鏈接 |
| Street Accident (SA) dataset | Risk Assessment(風險評估) | video num:1733 | 鏈接 |
| OTB-50 | visual tracking(跟蹤) | video num:50 | 鏈接 |
| OTB-100 | visual tracking(跟蹤) | video num:100 | 鏈接 |
| VOT2015 | visual tracking(跟蹤) | video num:60 | 鏈接 |
| ALOV300 | visual tracking(跟蹤) | video num:314 | 鏈接 |
| MOT | visual tracking(跟蹤) | video num:train:11 test:11 | 鏈接 |
| THUMOS | Temporal action localization(動作定位) | video num:~3K activities class:20 instances:~3K | 鏈接 |
| ActivityNet | Temporal action localization(動作定位) | video num:20k activities class:200 instances:7.6K | 鏈接 |
| Mexaction2 | Temporal action localization(動作定位) | activities class:2 instances:1975 | 鏈接 |
| FlyingChairs dataset | optical flow(光流) | image pairs:22k | 鏈接 |
| FlyingThings3D | optical flow(光流) | image pairs:22k | 鏈接 |
| KITTI benchmark suite | optical flow(光流) | image pairs:1600 | 鏈接 |
| MPI Sintel | optical flow(光流) | image pairs:1064 | 鏈接 |
Video Analysis & Scene Understanding
| UCF101 | 動作行為識別 | 13320 video,101類動作,主要是五大類:1)人-物交互;2)肢體運動;3)人-人交互;4)彈奏樂器;5)運動 | 鏈接 |
| HMDB51 | 動作行為識別 | 7000 videos,51類,包括人臉表情動作,身體動作,人與人交互等 | 鏈接 |
| Moments-in-Time | 動作行為識別 | 1,000,000 videos,339類 | 鏈接 |
| ActivityNet 1.3 | 動作行為識別 | 20,000 videos,200類 | 鏈接 |
| Kinetics | 動作行為識別 | 300,000 videos,400類 | 鏈接 |
| AVA | 動作行為識別 | 57,600 videos,80類 | 鏈接 |
| Collective Activity Dataset | 群體活動行為識別 | 44 videos,穿叉、行走、等待、交談和排隊 五類 | 鏈接 |
| Choi’s New Dataset | 群體活動行為識別 | 32 videos,聚會,談話,分開,一起走,追逐和排隊 六類 | None |
| ActivityNet 1.3 | 檢測動作事件的起始時間和終止時間 | 20,000 videos,200類動作的起始時間和終止時間 | 鏈接 |
| THUMOS | 檢測動作事件的起始時間和終止時間 | 15,000 videos,101類動作的起始時間和終止時間 | 鏈接 |
| MED | 事件檢測 | 32,744 videos,20個事件 | 鏈接 |
| EventNet | 事件檢測 | 90,000 videos,500個事件 | 鏈接 |
| Columbia Consumer Video | 事件檢測 | 9,317 videos,20個事件 | 鏈接 |
| ADE20K | 事件檢測 | 20,210 videos,900個事件 | 鏈接 |
| DAVIS | 視頻主物體分割 | 50 videos,分割標注 | 鏈接 |
| FBMS | 視頻主物體分割 | 59 videos,分割標注 | 鏈接 |
| IJB-C | 視頻人臉識別 | 11,000 videos, | 鏈接 |
| YouTube Faces | 視頻人臉識別 | 3,425 videos,1595 人 | 鏈接 |
| MS-Celeb-1M | 視頻人臉識別 | 1,000,000 images,21,000人 | 鏈接 |
| MSVD | 視頻描述 | 1,970 videos | 鏈接 |
| MSR-VTT-10K | 視頻描述 | 10,000 videos | 鏈接 |
| MSR-VTT-10K | 視頻描述 | 無 | 鏈接 |
3D Computer Vision
| photoface database | 基于光度立體視覺的二維和三維人臉識別數據庫 | 總共7356張圖像,包含1839個session和261個subjects | None |
| NYU Depth V2 dataset | 關于RGBD 圖像場景理解的數據庫 | 提供1449張深度圖片和他們的密集2d點類標注 | 鏈接 |
| SUN RGBD dataset | 是上面的NYU Depth V2 dataset的超集,多了3D bounding boxes和room layouts的標注。 | 有10,000張RGB-D圖片,有58,657個3D包圍框和146,617 個2d包圍框。 | 鏈接 |
| PASCAL3D+ | 新的三維物體檢測和姿態估計數據集,從PASCAL VOC 演化而來,包含圖像,注解,和3D CAD模型 | 總共12個類,平均每個類別有3000多個實例 | 鏈接 |
| IKEA | 包含典型室內場景的三維模型的數據庫,例如桌子椅子等 | 包含大約759張圖片和219個3D模型 | 鏈接 |
| New Tsukuba Dataset | 包含了很多立體物體對的數據庫,用于立體物體匹配 | 總共1800個立體物體對,以及每立體對的立體視差圖、遮擋圖和不連續圖 | 鏈接 |
| Oxford RobotCar Dataset | 關于戶外自動駕駛的數據集。 | 包含在駕駛汽車過程從6個攝像頭收集的2000w張圖片,和當時的激光雷達,GPS和地面實況標注。 | 鏈接 |
| Middlebury V3 | 包含高分辨率物體立體視差標注的數據庫 | 包含33個類,沒有明說每類有多少數據 | 鏈接 |
| ShapeNet | 包含3D模型,和3d模型的類別標注的數據集,覆蓋了常用的3D數據集PASCAL 3D+。 | 它涵蓋55個常見的對象類別,有大約51,300個3D模型 | 鏈接 |
| MICC dataset | 包含了3D人臉掃描和在不同分辨率,條件和縮放級別下的幾個視頻序列的數據庫。 | 有53個人的立體人臉數據 | 鏈接 |
| CMU MoCap Dataset | 包含了3D人體關鍵點標注和骨架移動標注的數據集。 | 有6個類別和23個子類別,總共2605個數據。 | 鏈接 |
| DTU dataset | 關于3D場景的數據集。 | 有124個場景,每場景有49/64個位置的RGB圖像和結構光標注。 | 鏈接 |
Analyzing Humans in Images
| MSR-Action3D | 包含深度的動作識別數據集, | 有20個動作,總共557個序列。 | 鏈接 |
| Florence-3D | 包含深度的動作識別數據集, | 有9個動作,總共215個動作序列。 | 鏈接 |
| Berkeley MHAD | 包含深度的動作識別數據集, | 有11個動作,產生660個動作序列。 | 鏈接 |
| Online Action Detection | 包含深度的動作識別數據集, | 數據集包含59個長序列,包含10種不同的日常生活行為。 | 鏈接 |
| ChaLearn LAP IsoGD Dataset | RGB-D圖像的手勢識別的數據集。 | 包括47933個RGB-D手勢視頻,有249個手勢標簽。Training有35878視頻,Validation有5784個,test有6271個 | 鏈接 |
| MAFA dataset | 關于面部遮擋問題的數據集 | 有30, 811張人臉和35806張有遮擋的臉組成。 | 鏈接 |
| MSRC-12 Kinect Gesture Dataset | 手勢識別數據集 | 有4900張圖片,包含12個不同手勢, | 鏈接 |
| 2013 Chalearn Gesture Challenge dataset | 手勢識別數據集 | 有11000張圖片,包含20個不同手勢, | 鏈接 |
| WIDER FACE | 人臉檢測數據集 | 有 32,203 張圖片,標注了393703個人臉。 | 鏈接 |
| FDDB | 人臉檢測數據集 | 2845張圖片,標注了5171張人臉。 | 鏈接 |
| 300-VW dataset | 面部表情數據集 | 包含114個視頻和總計218,595幀。 | 鏈接 |
| HMDB51 | 人類行為識別的數據集 | 包含51個動作,總共有6766個視頻剪輯 | 鏈接 |
| MPII Cooking Activities Dataset | 人類行為識別的數據集 | 包含65個動作,有5609個視頻 | 鏈接 |
| UCF101 | 人類行為識別的數據集 | 包含101個動作,有13320個視頻 | 鏈接 |
| IJB-A dataset | 包含視頻和圖片人臉識別的數據集 | 包含5712個圖像和2085個視頻 | 鏈接 |
| YouTube celebrities | 視頻人臉識別的數據集 | 包含47位名人的1910個視頻 | 鏈接 |
| COX | 視頻人臉識別的數據集 | 包含1000個主題的4000個視頻 | 鏈接 |
| Human3.6M | 人體姿態估計的數據集 | 360萬張3D照片,11名受試者在4個視點下執行15個了不同的動作 | 鏈接 |
| iLIDS | 行人重識別的數據集 | 476 張圖像,包含119個人 | 鏈接 |
| VIPeR | 行人重識別的數據集 | 632個行人圖片對(由兩個相機拍攝) | 鏈接 |
| CUHK01 | 行人重識別的數據集 | 包含971行人, 3884張圖片 | 鏈接 |
| CUHK03 | 行人重識別的數據集 | 包含1360行人, 13164張圖片 | 鏈接 |
| RWTH-PHOENIX-Weather multi-signer 2014 | 手語識別的數據集 | 包含了5672個德語手語的句子,有65,227個手語姿勢和799,006幀 | 鏈接 |
| AFLW | 人類面部關鍵點的數據集 | 總共約有25k張臉,每幅圖像標注了大約21個位置。 | 鏈接 |
| CMU mocap database | 動作識別的數據集 | 2235個數據,包含144個不同的動作。 | 鏈接 |
| Georgia Tech (GT) database | 人臉識別數據庫 | 50個人每人15張人臉。 | 鏈接 |
| ORL | 人臉識別數據庫 | 40個人每個人10張圖。 | 鏈接 |
Application
| DogCentric Activity Dataset | 第一視角的狗和人之間的相互行為的數據集(視頻) | 總共有10類,具體數據量沒有明說,y是動作類別 | 鏈接 |
| JPL First-Person Interaction Dataset | 第一視角觀察動作的數據集 | 57個視頻,8個大類,y是動作類別 | 鏈接 |
| NUS-WIDE | 關于圖像文本匹配的數據集 | 269,648個圖像和對應的標簽 | 鏈接 |
| LabelMe Dataset | 關于圖像文本匹配的數據集 | 3825個圖像和對應標簽 | 鏈接 |
| Pascal Dataset | 關于圖像文本匹配的數據集 | 5011張訓練圖像和4952張測試圖像 | ) |
| ICDAR 2015 | 關于文本檢測的數據集 | 1500張訓練,1000張測試,y為四邊形的四個頂點。 | 鏈接 |
| COCO-Text | 關于文本檢測的數據集 | 63686張圖片,其中43686張被選為訓練集,剩下的2萬用于測試。 | 鏈接 |
| MSRA-TD500 | 關于文本檢測的數據集 | 300個訓練,200個測試圖像 | 鏈接 |
| Microsoft 7-Scenes Dataset | 室內人體運動的數據集 | 有7種不同室內環境,每包含500-1000張圖像視頻序列。 | 鏈接 |
| Oxford RobotCar | 戶外自動駕駛數據集 | 包含圖像,激光掃描結果和GPS數據。 | 鏈接 |
Low- & Mid-Level Vision
| Deep Video Deblurring for Hand-held Cameras | video/image deblurring(圖像去模糊) | video num:71 video time: 3-5s blurry and sharp pair image num:6708 | 鏈接 |
| GOPRO dataset | video/image deblurring(圖像去模糊) | blurry and sharp pair image num:3214 train num:2103 test num:1111 | 鏈接 |
| BSD68 | image restoration(圖像修復)/高斯降噪 | image num:68 | 鏈接 |
| BSD100 | “image restoration(圖像修復)super resolution超分辨率重建” | image num:100 | 鏈接 |
| Set5 | “image restoration(圖像修復)super resolution超分辨率重建” | image num:5 | 鏈接 |
| Set14 | “image restoration(圖像修復)super resolution超分辨率重建” | image num:14 | 鏈接 |
| Urban100 | “image restoration(圖像修復)super resolution超分辨率重建” | image num:100 | 鏈接 |
| NYU v2 dataset | “image restoration(圖像修復)depth super resolution深度超分辨率重建” | image num:1449 | 鏈接 |
| Middlebury dataset | “image restoration(圖像修復)depth super resolution深度超分辨率重建” | image pair num: 33 | 鏈接 |
| alpha matting benchmark | Natural image matting(摳圖) | “train num:27,test num:8” | 鏈接 |
| real image benchmark | Natural image matting(摳圖) | “train num:49300,test num:1000” | 鏈接 |
| MSRA10K/MSRA-B | Image saliency detection(顯著性區域檢測) | image num(MSRA10K):10000 image num(MSRA-B):5000 | 鏈接 |
| ECSSD | Image saliency detection(顯著性區域檢測) | image num:1000 | 鏈接 |
| DUT-OMRON | Image saliency detection(顯著性區域檢測) | image num:5168 | 鏈接 |
| PASCAL-S | Image saliency detection(顯著性區域檢測) | image num:850 | 鏈接 |
| HKU-IS | Image saliency detection(顯著性區域檢測) | image num:4447 | 鏈接 |
| SOD | Image saliency detection(顯著性區域檢測) | image num:300 | 鏈接 |
| Describable Textures Dataset | texture synthesis(紋理合成) | image num:5640 category num:47 split train:val:test = 1:1:1 | 鏈接 |
| CVPPP leaf segmentation | Instance segmentation(樣例分割) | image num: 161 train num: 128 test num: 33 | 鏈接 |
| KITTI car segmentation | Instance segmentation(樣例分割) | image num: 3976 train num: 3712 test num: 144 val:120 | 鏈接 |
| Cityscapes | Instance segmentation(樣例分割) | image num: 5000 train num: 2975 test num: 1525 val:500 | 鏈接 |
| SYMMAX | Symmetry Detection(對稱性檢測) | image num: train:200 test:100 | 鏈接 |
| WHSYMMAX | Symmetry Detection(對稱性檢測) | image num: train:228 test:100 object num: 1 | 鏈接 |
| SK506 | Symmetry Detection(對稱性檢測) | image num: train:300 test:206 object num: 16 | 鏈接 |
| Sym-PASCAL | Symmetry Detection(對稱性檢測) | image num: train:648 test:787 object num: 14 | 鏈接 |
| Color Checker Dataset | Color constancy(顏色恒定) | image num: 568 | 鏈接 |
| NUS 8-Camera Dataset | Color constancy(顏色恒定) | image num: 1736 | 鏈接 |
Text
| Stanford Sentiment Treebank | 文本情感分析 | 11855個句子劃分為239231個短語,每個短語有個概率值,越小越負面,越大越正面 | 鏈接 |
| IMDB | 文本情感分析 | 100,000句子,正面負面兩類 | 鏈接 |
| Yelp | 文本情感分析 | 無 | 鏈接 |
| Multi-Domain Sentiment Dataset(Amazon product) | 文本情感分析 | 100,000+句子,正面負面2類或強正面、弱正面、中立、弱負面、強負面5類 | 鏈接 |
| SemEval | 文本情感分析 | 20,632句子,三類(正面、負面、中立) | 鏈接 |
| Sentiment140(STS) | 文本情感分析 | 1,600,000句子,三類(正面、負面、中立) | 鏈接 |
總結
- 上一篇: 图像分割——Multi-Scale an
- 下一篇: 行人属性识别一:训练PA100k数据集