生活随笔
收集整理的這篇文章主要介紹了
常用的图像数据集
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
原文鏈接:http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm
CVonline:圖像數(shù)據(jù)庫 (Google直譯的結(jié)果,希望對大家有幫助)
按主題索引 行動數(shù)據(jù)庫 屬性識別 自主駕駛 生物/醫(yī)藥 相機(jī)校準(zhǔn) 臉和眼/虹膜數(shù)據(jù)庫 指紋 一般圖像 一般RGBD和深度數(shù)據(jù)集 一般視頻 手,掌握,手動和手勢數(shù)據(jù)庫 圖像,視頻和形狀數(shù)據(jù)庫檢索 對象數(shù)據(jù)庫 人(靜),人體姿勢 人員檢測和跟蹤數(shù)據(jù)庫(另見監(jiān)控) 遙感 場景或地點(diǎn)分割或分類 分割 同時本地化和映射 監(jiān)視和跟蹤(另見人物) 紋理 城市數(shù)據(jù)集 其他收藏頁 雜項(xiàng)主題 另一個有用的網(wǎng)站是YACVID頁面。
行動數(shù)據(jù)庫 3D在線動作數(shù)據(jù)集?- 有七個動作類(微軟和南洋理工大學(xué)) 50沙拉?- RGB-D視頻+加速度計(jì)數(shù)據(jù)的完整注釋4.5小時數(shù)據(jù),捕獲25人準(zhǔn)備兩個混合沙拉(鄧迪大學(xué),塞巴斯蒂安·斯坦因) ActivityNet?- 人類活動理解的大規(guī)模視頻基準(zhǔn)(200個課堂,每班100個視頻,648個視頻小時)(Heilbron,Escorcia,Ghanem和Niebles) ASLAN行動相似性標(biāo)簽挑戰(zhàn)數(shù)據(jù)庫(Orit Kliper-Gross) 視頻中的動作檢測?- MERL購物數(shù)據(jù)集由106個視頻組成,每個視頻都是大約2分鐘的序列(Michael Jones,Tim Marks) 演員和動作數(shù)據(jù)集?–3782視頻,七個演員執(zhí)行八個不同的動作(徐,謝,熊,科索) 針對動作識別的各種標(biāo)簽視頻數(shù)據(jù)集的分析整理(Kevin Murphy) BEHAVE交互人視頻數(shù)據(jù)與標(biāo)記(Scott Blunsden,Bob Fisher,Aroosha Laghaee) BU動作數(shù)據(jù)集?- 與視頻數(shù)據(jù)集UCF101和ActivityNet的類別具有1:1對應(yīng)關(guān)系的三個圖像動作數(shù)據(jù)集(BU101,BU101-未過濾,BU203未過濾)。(S.Ma,SABargal,J.Zhang,L.Sigal,S.Sclaroff。) 伯克利MHAD:綜合多式聯(lián)運(yùn)行動數(shù)據(jù)庫(Ferda Ofli) 伯克利多式聯(lián)運(yùn)行動數(shù)據(jù)庫?- 擴(kuò)大應(yīng)用領(lǐng)域的五種不同方式(加利福尼亞大學(xué)伯克利分校和約翰霍普金斯大學(xué)) 早餐數(shù)據(jù)集?- 這是一個數(shù)據(jù)集,有1712個視頻剪輯,顯示10個廚房活動,手動分為48個原子動作類。(H.Kuehne,AB Arslan和T. Serre) 布里斯托爾中心對象交互數(shù)據(jù)集?- 包含從六位不同位置執(zhí)行任務(wù)的3-5位用戶(第一人稱(自我中心))拍攝的視頻(Dima Damen,Teesid Leelaswassuk和Walterio Mayol-Cuevas,Bristol University) 棕色早餐動作數(shù)據(jù)集?- 70小時,400萬幀10種不同的早餐準(zhǔn)備活動(Kuehne,Arslan和Serre) CAD-120數(shù)據(jù)集?- 專注于高水平的活動和對象互動(康奈爾大學(xué)) CAD-60數(shù)據(jù)集?- CAD-60和CAD-120數(shù)據(jù)集包括人類執(zhí)行活動的RGB-D視頻序列(康奈爾大學(xué)) CVBASE06:注釋體育視頻(Janez Pers) Charades?數(shù)據(jù)集?- 來自267名志愿者的10,000個視頻,每個注釋有多個活動,標(biāo)題,對象和時間本地化。(Sigurdsson,Varol,Wang,Laptev,Farhadi,Gupta) 組合活動數(shù)據(jù)集?- 提供了由14個科目和注釋執(zhí)行的26個原子行為的16種活動類別的不同組合(智利大學(xué)和智利大學(xué)) 康乃爾活動數(shù)據(jù)集CAD 60,CAD 120(康奈爾機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室) DMLSmartActions數(shù)據(jù)集?- 十六名科目以自然方式進(jìn)行了12種不同的行動(不列顛哥倫比亞大學(xué)) 深度包含的人類行動視頻數(shù)據(jù)集?- 它包含23個不同的動作(中國科學(xué)院CITI) DogCentric活動數(shù)據(jù)集?- 從安裝在*狗*上方的相機(jī)拍攝的第一人稱視頻(Michael Ryoo) ETS曲棍球比賽事件數(shù)據(jù)集?- 此數(shù)據(jù)集包含使用固定攝像機(jī)捕獲的兩個曲棍球游戲的素材。(M.-A.Carneau,AJRaymond,E.Granger,和G.Gagnon) FCVID:復(fù)旦 - 哥倫比亞視頻數(shù)據(jù)集?- 91,223根據(jù)239類手動注釋的網(wǎng)絡(luò)視頻(Jiang,Wu,Wang,Xue,Chang) G3D?- 使用Microsoft Kinect(Victoria Bloom)捕獲的20場游戲動作的同步視頻,深度和骨架數(shù)據(jù) G3Di?- 此數(shù)據(jù)集包含12對科目分為6對(金斯頓大學(xué)) 游戲3D數(shù)據(jù)集?- 游戲場景中的實(shí)時動作識別(金士頓大學(xué)) 佐治亞州技術(shù)中心活動 - 凝視(+)?- 人們觀看的視頻和他們的目光位置(Fathi,Li,Rehg) HMDB:大型人體運(yùn)動數(shù)據(jù)庫(Serre Lab) 好萊塢3D數(shù)據(jù)集?- 650個3D視頻剪輯,跨越14個動作類(Hadfield和Bowden) 人類行為和場景數(shù)據(jù)集(Marcin Marszalek,Ivan Laptev,Cordelia Schmid) HumanEva:用于評估人體運(yùn)動的同步視頻和運(yùn)動捕獲數(shù)據(jù)集(布朗大學(xué)) I-LIDS視頻事件圖像數(shù)據(jù)集(智能檢測系統(tǒng)的圖像庫)(Paul Hosner) I3DPost多視圖人體動作數(shù)據(jù)集(Hansung Kim) IAS實(shí)驗(yàn)室行動數(shù)據(jù)集?- 包含充分的行動和執(zhí)行行動的人數(shù)(帕多瓦大學(xué)的IAS實(shí)驗(yàn)室) INRIA Xmas運(yùn)動采集序列(IXMAS)(INRIA) InfAR數(shù)據(jù)集 - 不同時期的紅外線動作識別神經(jīng)計(jì)算(陳強(qiáng)強(qiáng),銀河杜江江,Jing Lv,Luyu Yang,Deyu Meng,Alexander G. Hauptmann) JPL第一人稱交互數(shù)據(jù)集?- 從第一人稱角度拍攝的7種人類活動視頻(Michael S. Ryoo,JPL) 耶拿動作識別數(shù)據(jù)集?- 愛博犬行動(Korner和Denzler) K3Da - Kinect 3D活動數(shù)據(jù)集?- K3Da(Kinect 3D活動)是一個現(xiàn)實(shí)的臨床相關(guān)的人類行動數(shù)據(jù)集,包含骨骼,深度數(shù)據(jù)和相關(guān)的參與者信息(D.Lightley,MH Yap,J.Corulson,Y.Banouin和JSMcPhee) KIT Robo-Kitchen活動數(shù)據(jù)集?- 共有17人組成的540個剪輯,進(jìn)行12個復(fù)雜的廚房活動(L。Rybok,S. Friedberger,UD Hanebeck,R. Stiefelhagen) KTH人類動作識別數(shù)據(jù)庫(KTH?CVAP實(shí)驗(yàn)室) 卡爾斯魯厄動作,意圖和活動數(shù)據(jù)集(MINTA)?- 7種日常生活活動,包括全部運(yùn)動原始部分(D。Gehrig,P.Krauthausen,L.Rybok,H.Kuehne,UDHanebeck,T.Schultz, Stiefelhagen) LIRIS人類活動數(shù)據(jù)集?- 包含(灰色/ rgb /深度)視頻,顯示執(zhí)行各種活動的人(法國國家科學(xué)研究中心) LIRIS人類活動數(shù)據(jù)集?- 2個相機(jī),注釋,深度圖像(Christian Wolf,et al) MEXaction2行動檢測和本地化數(shù)據(jù)集?- 支持在相對較大的視頻數(shù)據(jù)庫中“發(fā)現(xiàn)”短時間動作的方法的開發(fā)和評估:77小時,117視頻(Michel Crucianu和Jenny Benois-Pineau) MPII烹飪活動數(shù)據(jù)集(M. Rohrbach) MSR-Action3D?- 基準(zhǔn)RGB-D動作數(shù)據(jù)集(Microsoft Research Redmond和臥龍崗大學(xué)) MSRActionPair數(shù)據(jù)集?- :深度序列活動識別的面向4D法線的直方圖(佛羅里達(dá)州中部和微軟大學(xué)) MSRC-12 Kinect手勢數(shù)據(jù)集?- 來自執(zhí)行12個手勢的人的594個序列和719,359個幀(Microsoft Research Cambridge) MSRC-12數(shù)據(jù)集?- 代表身體部位的人類運(yùn)動序列,以及相關(guān)的手勢(Microsoft Research Cambridge and Cambridge of Cambridge) MSRDailyActivity3D數(shù)據(jù)集?- 有16項(xiàng)活動(微軟和西北大學(xué)) ManiAc?RGB-D動作數(shù)據(jù)集:不同的操作動作,15個不同的版本,30個不同的對象被操縱,20個長和復(fù)雜的鏈接操作序列(Eren Aksoy) Mivia數(shù)據(jù)集?- 由14個科目執(zhí)行的7個高級動作組成。(Salemo大學(xué)的Mivia Lab) MuHAVi?- Multicamera人類行動視頻數(shù)據(jù)(Hossein Ragheb) 多模式動作檢測(MAD)數(shù)據(jù)集?- 它包含20個主題執(zhí)行的35個連續(xù)動作。(卡內(nèi)基梅隆大學(xué)) Multiview 3D事件數(shù)據(jù)集?- 此數(shù)據(jù)集包括由8名科目(加利福尼亞大學(xué)洛杉磯分校)執(zhí)行的8類事件, NTU RGB + D動作識別數(shù)據(jù)集?- NTU RGB + D是人類行動識別的大規(guī)模數(shù)據(jù)集(Amir Shahroudy) 西北UCLA Multiview Action 3D?- 有10個動作類別:(西北大學(xué)和加利福尼亞大學(xué)洛杉磯分校) 基于牛津電視的人際交往(Oxford Visual Geometry Group) 議會?- 議會數(shù)據(jù)集是228個視頻序列的集合,描述了希臘議會的政治演講(Michalis Vrigkas,Christophoros Nikou,Ioannins A. kakadiaris) RGB-D活動數(shù)據(jù)集?-?數(shù)據(jù)集中的每個視頻包含涉及與不同對象交互的2-7個動作。(康奈爾大學(xué)和斯坦福大學(xué)) RGBD-Action-Completion-2016?- 此數(shù)據(jù)集包含414個完整/不完整的對象交互序列,跨越六個動作并呈現(xiàn)RGB,深度和骨架數(shù)據(jù)。(Farnoosh Heidarivincheh,Majid Mirmehdi,Dima Damen) RGBD-SAR數(shù)據(jù)集?- RGBD-SAR數(shù)據(jù)集(中國和微軟電子科技大學(xué)) 羅切斯特日常活動數(shù)據(jù)集活動(Ross Messing) SBU Kinect交互數(shù)據(jù)集?- 它包含八種類型的交互(石溪大學(xué)) SBU-Kinect-Interaction數(shù)據(jù)集v2.0?- 它由人類執(zhí)行互動活動(Kiwon Yun等)的RGB-D視頻序列組成 SDHA人類活動的語義描述2010年比賽 - 人類互動(Michael S.?Ryoo,JK Aggarwal,Amit K. Roy-Chowdhury) SDHA人類活動語義描述2010年比賽 - 空中觀點(diǎn)(Michael S. Ryoo,JK Aggarwal,Amit K. Roy-Chowdhury) SFU排球組活動識別?-?排球視頻的?2個級別注釋數(shù)據(jù)集(9個玩家的動作和8個場景的活動)(M。Ibrahim,S. Muralidharan,Z.Deng,A.Vahdat和G. Mori / Simon Fraser University) SYSU 3D人對象交互數(shù)據(jù)集?- 四十個科目進(jìn)行12個不同的活動(中山大學(xué)) ShakeFive數(shù)據(jù)集?- 只包含兩個動作,即手搖和高5。(烏特勒支大學(xué)) ShakeFive2?- 在153個高清視頻中的八個類別上具有肢體等級注釋的二元人機(jī)交互數(shù)據(jù)集(Coert van Gemeren,Ronald Poppe,Remco Veltkamp) 野蠻體育視頻(SVW)?- SVW由Coach Eye智能手機(jī)應(yīng)用程序用戶完全由智能手機(jī)拍攝的4200個視頻,由TechSmith公司開發(fā)的運(yùn)動訓(xùn)練領(lǐng)先應(yīng)用程序(Seyed Morteza Safdarnejad,Xiaoming Liu) 斯坦福體育賽事數(shù)據(jù)集(佳麗) 利茲活動數(shù)據(jù)集 - 早餐(LAD - 早餐)?- 由15個注釋的視頻組成,代表五個不同的人吃早餐或其他簡單的餐點(diǎn); (John Folkesson等人) THUMOS?- 在時尚未剪輯的視頻中的行動識別! - 430小時的視頻數(shù)據(jù)和4500萬幀(Gorban,Idrees,Jiang,Zamir,Laptev Shah,Sukthanka) TUM廚房數(shù)據(jù)集日常操作活動(Moritz Tenorth,Jan Bandouch) 電視人類交互數(shù)據(jù)集(Alonso Patron-Perez) 墮落檢測數(shù)據(jù)集?- 兩個風(fēng)景中的六個科目連續(xù)進(jìn)行了一系列行動(德克薩斯大學(xué)) TJU數(shù)據(jù)集?- 包含由兩個不同環(huán)境中的20個科目執(zhí)行的22個動作; 共有1760個序列。(天津大學(xué)) UCF-iPhone數(shù)據(jù)集?- 9在Apple iPhone 4智能手機(jī)上使用慣性測量單元(IMU)從(6-9)科目記錄有氧運(yùn)動。(Corey McCall,Kishore Reddy和Mubarak Shah) UPCV動作數(shù)據(jù)集?- 數(shù)據(jù)集由20個對象執(zhí)行10次動作兩次。(帕特雷大學(xué)) UC-3D運(yùn)動數(shù)據(jù)庫?- 可用的數(shù)據(jù)類型包括采用Xsens和Microsoft Kinect RGB和深度圖像的MVN Suit采集的高分辨率運(yùn)動捕捉(葡萄牙科英布拉系統(tǒng)與機(jī)器人研究所) UCF 101動作數(shù)據(jù)集?101個動作類,超過13k個剪輯和27小時的視頻數(shù)據(jù)(佛羅里達(dá)州中部大學(xué)) UCFKinect?- 數(shù)據(jù)集由16個動作組成(中佛羅里達(dá)州奧蘭多大學(xué)) UCR Videoweb多攝像機(jī)廣域活動數(shù)據(jù)集(Amit K. Roy-Chowdhury) UTD-MHAD?- 八個科目進(jìn)行了四次動作四次。(得克薩斯大學(xué)達(dá)拉斯分校) UTKinect數(shù)據(jù)集?- 由10名受試者(德克薩斯大學(xué))進(jìn)行了兩次人類行為, UWA3D多視角活動數(shù)據(jù)集?- 10個人(西澳大利亞大學(xué))進(jìn)行了30?次活動, 中央佛羅里達(dá)大學(xué) - 50實(shí)際視頻中的行動類別識別(3 GB)(Kishore Reddy) 中央佛羅里達(dá)大學(xué) - ARG天文攝像機(jī),屋頂攝像機(jī)和地面攝像機(jī)(UCF計(jì)算機(jī)視覺實(shí)驗(yàn)室) 佛羅里達(dá)州中部大學(xué) - 特色影片動作數(shù)據(jù)集(佛羅里達(dá)州中部大學(xué)) 佛羅里達(dá)州中部大學(xué) - 體育行動數(shù)據(jù)集(佛羅里達(dá)州中部大學(xué)) 佛羅里達(dá)州中部大學(xué) - YouTube行動數(shù)據(jù)集(體育)(佛羅里達(dá)州中部大學(xué)) 烏特勒支多人運(yùn)動基準(zhǔn)(UMPM)。?- 基于運(yùn)動捕捉數(shù)據(jù)的人物視頻錄像和地面實(shí)況的集合(NP van der Aa,X.Ro,GJ Giezeman,RT Tan,RC Veltkamp。) VIRAT視頻數(shù)據(jù)集?- 涉及人類和車輛的兩大類活動(單個對象和兩個對象)的事件識別。(Sangmin Oh等) 維羅納社交互動數(shù)據(jù)集(Marco Cristani) ViHASi:虛擬人類動作剪影數(shù)據(jù)(userID:VIHASI密碼:虛擬$虛擬)(金斯頓大學(xué)Hossein Ragheb) Videoweb(multicamera)活動數(shù)據(jù)集(B.Bhanu,G.Dinina,C.Ding,A.Ivers,A.Kalal,C.Ravishankar,A.Roy-Chowdhury,B.Varda) WVU多視圖動作識別數(shù)據(jù)集(西維吉尼亞大學(xué)) 鍛煉SUU-10?Kinect數(shù)據(jù)集練習(xí)動作(Ceyhun Akgul) WorkoutSU-10數(shù)據(jù)集?- 包含由專業(yè)培訓(xùn)師選擇用于治療目的的鍛煉動作。(Sabanc大學(xué)) 手腕攝像機(jī)視頻數(shù)據(jù)集?- 對象操縱(Ohnishi,Kanehira,Kanezaki,原田) YouCook?- 88個帶有注釋的開源YouTube烹飪視頻(Jason Corso) YouTube-8M數(shù)據(jù)集?- 視頻理解研究(Google Inc.)的大型多樣化標(biāo)簽視頻數(shù)據(jù)集 屬性識別 鳥類這個數(shù)據(jù)庫包含六個不同類別鳥類的600張圖像(每個100個樣本)(Svetlana Lazebnik,Cordelia Schmid和Jean Ponce) 蝴蝶這個數(shù)據(jù)庫包含619個不同類別的蝴蝶的圖像。(Svetlana Lazebnik,Cordelia Schmid和Jean Ponce) CALVIN研究組數(shù)據(jù)集?- 眼睛跟蹤對象檢測,imagenet邊界框,同步活動,stickman和身體姿勢,youtube對象,臉,馬,玩具,視覺屬性,形狀類(CALVIN ggroup) CelebA?- 大型CelebFaces屬性數(shù)據(jù)集(Ziwei Liu,Ping Luo,Xiaogang Wang,Xiaoou Tang) HAT數(shù)據(jù)庫的27個人類屬性(Gaurav Sharma,Frederic Jurie) LFW-10數(shù)據(jù)集,用于學(xué)習(xí)相對屬性?- 具有10個屬性的實(shí)例級注釋的10,000對面部圖像的數(shù)據(jù)集(CVIT,IIIT Hyderabad。) 個人照片集中的人物識別?- 我們?yōu)樵u估和長時間屬性注釋和每張照片時間戳元數(shù)據(jù)引入了三個更難的劃分(噢,Seong Joon和Benenson,Rodrigo和Fritz,Mario和Schiele,Bernt) 可視屬性數(shù)據(jù)集超過500個對象類(動畫和無生命)的視覺屬性注釋,都在ImageNet中表示。每個對象類都基于具有636個屬性的分類法(例如,具有金屬制成的毛皮,圓形)的視覺屬性來注釋。 WIDER屬性數(shù)據(jù)集?- WIDER屬性是一個大規(guī)模的人類屬性數(shù)據(jù)集,其中13789個圖像屬于30個場景類別,每個57524個人體邊界框分別用14個二進(jìn)制屬性注釋(Li,Yining和Huang,Chen,Loy,Chen Change和唐,小ou) 自主駕駛 AMUSE?- 在多個測試驅(qū)動器中采用實(shí)際交通場景的汽車多傳感器(AMUSE)數(shù)據(jù)集。(Philipp Koschorrek等) 自主駕駛?- 語義分割,行人檢測,虛擬世界數(shù)據(jù),遠(yuǎn)紅外,立體聲,駕駛員監(jiān)控(CVC研究中心,UAB和UPC大學(xué)) 自主駕駛(JAAD)的共同關(guān)注?- 數(shù)據(jù)集包括主要用于在自主駕駛中進(jìn)行行為研究和檢測的行人和汽車的實(shí)例(Iuliia Kotseruba,Amir Rasouli和John K. Tsotsos) LISA車輛檢測數(shù)據(jù)集?- 在各種照明和交通條件下駕駛視頻的顏色第一人稱(Sivaraman,Trivedi) 遺失和找到的數(shù)據(jù)集?- 失物招領(lǐng)數(shù)據(jù)集解決了自主駕駛應(yīng)用中發(fā)現(xiàn)意外的小型道路危險(xiǎn)(通常由貨物丟失造成的)的問題。(Sebastian Ramos,Peter Pinggera,Stefan Gehrig,Uwe Franke,Rudolf Mester,Carsten Rother) SYNTHIA?- 大型(約五十萬)虛擬世界圖像,用于訓(xùn)練自主車輛。(計(jì)算機(jī)視覺中心的ADAS集團(tuán)) 圖像和注釋的合成集合?- 在駕駛場景的背景下輔助語義分割和相關(guān)場景理解問題的目的(計(jì)算機(jī)視覺中心,UAB) 生物/醫(yī)藥 2008年MICCAI MS病變分期挑戰(zhàn)(國家衛(wèi)生研究院神經(jīng)科學(xué)研究藍(lán)圖) ASU DR-AutoCC數(shù)據(jù)?- 糖尿病視網(wǎng)膜病變分類數(shù)據(jù)集的多實(shí)例學(xué)習(xí)特征空間(Ragav Venkatesan,Parag Chandakkar,Baoxin Li - Arizona State University) Aberystwyth葉評估數(shù)據(jù)集?- 用手標(biāo)記植物圖像,用手標(biāo)記一段時間的葉級分割,以及植物犧牲的生物數(shù)據(jù)。(Bell,Jonathan; Dee,Hannah M.) 脊柱CT脊柱CT數(shù)據(jù)庫用于脊柱定位的定位,125例,242次掃描(Ben Glockern) BRATS?- 大腦多參數(shù)磁共振圖像中腫瘤結(jié)構(gòu)的識別和分割(TU Munchen等) CRCHisto表型 - 標(biāo)記細(xì)胞核數(shù)據(jù)?- 結(jié)腸直腸癌組織學(xué)圖像由近30,000個點(diǎn)狀細(xì)胞核組成,超過22,000個標(biāo)記細(xì)胞類型(Rajpoot + Sirinukunwattana) CREMI:MICCAI 2016挑戰(zhàn)?- 6卷神經(jīng)組織電子顯微鏡,神經(jīng)元和突觸分割,突觸伴侶注釋。(Jan Funke,Stephan Saalfeld,Srini Turaga,Davi Bock,Eric Perlman) Cavy?Action數(shù)據(jù)集?- 具有以每秒7.5幀(fps)記錄的640×480分辨率的16個序列,總共有大約31621506幀(272GB)的相互作用的空穴(豚鼠)(Al-Raziqi和Denzler) 細(xì)胞跟蹤挑戰(zhàn)數(shù)據(jù)集?- 具有地面真相的2D / 3D延時視頻序列(Ma et al。,Bioinformatics 30:1609-1617,2014) 計(jì)算機(jī)斷層掃描肺氣腫數(shù)據(jù)庫(Lauge?Sorensen) DIADEM:軸突和樹突狀形態(tài)學(xué)競賽的數(shù)字重建(艾倫腦科學(xué)研究所等) DIARETDB1 - 標(biāo)準(zhǔn)糖尿病視網(wǎng)膜病變數(shù)據(jù)庫(Lappeenranta Univ of Technology) 驅(qū)動:用于血管提取的數(shù)字視網(wǎng)膜圖像(烏得勒支大學(xué)) DeformIt 2.0?- 圖像數(shù)據(jù)增強(qiáng)工具:從單個圖像分割對(Brian Booth和Ghassan Hamarneh)模擬具有地面真實(shí)分割的新穎圖像 可變形圖像注冊實(shí)驗(yàn)室數(shù)據(jù)集?- 用于客觀和可靠地評估可變形圖像配準(zhǔn)(DIR)空間精度性能。(Richard Castillo等人) 皮膚鏡像(Eric Ehrsam) EPT29。該數(shù)據(jù)庫包含4842個EPTs分類群的1613個標(biāo)本的圖像(Tom等) FIRE眼底圖像注冊數(shù)據(jù)集?- 134視網(wǎng)膜圖像對和注冊真實(shí)(FORTH-ICS) IRMA(醫(yī)學(xué)應(yīng)用中的圖像檢索)?- 該集合編輯匿名X射線照片(Deserno TM,Ott B) KID?- 用于醫(yī)療決策支持的膠囊內(nèi)窺鏡數(shù)據(jù)庫(Anastasios Koulaouzidis和Dimitris Iakovidis) 葉片分割挑戰(zhàn)煙草和擬南芥植物圖像(Hanno Scharr,Massimo Minervini,Andreas Fischbach,Sotirios A. Tsaftaris) MIT CBCL自動鼠標(biāo)行為識別數(shù)據(jù)集(Nicholas Edelman) MUCIC:Ma??saryk大學(xué)細(xì)胞圖像收集?- 2D / 3D合成圖像的細(xì)胞/組織為基準(zhǔn)(Masaryk大學(xué)) MiniMammographic數(shù)據(jù)庫(Mammographic Image Analysis Society) 蛾精細(xì)識別?- 675個相似的類,5344個圖像(Erik Rodner等) 小鼠胚胎跟蹤數(shù)據(jù)庫?- 細(xì)胞分裂事件檢測(Marcelo Cicconet,Kris Gunsalus) OASIS?- 開放獲取系統(tǒng)的成像研究 - 大腦的500+ MRI數(shù)據(jù)集(華盛頓大學(xué),哈佛大學(xué),生物醫(yī)學(xué)信息學(xué)研究網(wǎng)絡(luò)) 植物表型數(shù)據(jù)集?- 適用于植物和葉片檢測,分割,跟蹤和物種識別的植物數(shù)據(jù)(M. Minervini,A.Fischbach,H. Scharr,SA Tsaftaris) 視網(wǎng)膜眼底圖像 - 血管分叉和交叉的地面實(shí)況(格羅寧根大學(xué)) 視網(wǎng)膜的結(jié)構(gòu)分析?- 描述(400+視網(wǎng)膜圖像,具有地面真實(shí)分段和醫(yī)學(xué)注釋) 脊柱和心臟數(shù)據(jù)(倫敦安大略省數(shù)字成像組,碩士) Stonefly9該數(shù)據(jù)庫包含826個973個分類群的Stoneflies(Tom等)的圖像, 合成遷移細(xì)胞?- 超過98個時間幀的人造遷移細(xì)胞(嗜中性粒細(xì)胞),各種級別的高斯/泊松噪聲和不同路徑特征與地面實(shí)況。(Constantino Carlos Reyes-Aldasoro博士) 佛羅里達(dá)州中部大學(xué) - DDSM:用于篩查乳房X線攝影的數(shù)字?jǐn)?shù)據(jù)庫(佛羅里達(dá)州中部大學(xué)) VascuSynth?- 120具有地面真相結(jié)構(gòu)的3D血管樹(Mengliu Zhao,Ghassan Hamarneh) VascuSynth?- 血管合成器在3D體積中產(chǎn)生血管。(Ghassan Hamarneh,Preet Jassi,Mengliu Zhao) 約克心臟MRI數(shù)據(jù)集(Alexander Andreopoulos) 相機(jī)校準(zhǔn) 反折射相機(jī)校準(zhǔn)圖像(Yalin Bastanlar) GoPro-Gyro數(shù)據(jù)集?- 該數(shù)據(jù)集由許多具有相應(yīng)陀螺儀測量(Hannes等)的廣角滾動快門視頻序列組成, LO-RANSAC?-LO-RANSAC用于估計(jì)單應(yīng)力和對極幾何的庫(K.Lebeda,J.Matas和O.Chum) 臉和眼/虹膜數(shù)據(jù)庫 300視頻(300 VW)?- 68面部地標(biāo)跟蹤(Chrysos,Antonakos,Zafeiriou,Snape,Shen,Kossaifi,Tzimiropoulos,Pantic) 3D面具攻擊數(shù)據(jù)庫(3DMAD)?- 使用Kinect RGBD與眼睛位置的1765人的幀(Sebastien Marcel) 3D面部表情?- 賓漢頓大學(xué)3D靜態(tài)和動態(tài)面部表情數(shù)據(jù)庫(Lijun Yin,Jeff Cohn和隊(duì)友) 用于面部和揚(yáng)聲器識別的視聽數(shù)據(jù)庫(Mobile Biometry MOBIO http://www.mobioproject.org/) BANCA面部和語音數(shù)據(jù)庫(薩里大學(xué)) Binghampton Univ 3D靜態(tài)和動態(tài)面部表情數(shù)據(jù)庫(Lijun Yin,Peter Gerhardstein和隊(duì)友) 賓漢頓匹茲堡4D自發(fā)面部表情數(shù)據(jù)庫?- 由2D自發(fā)面部表情視頻和FACS代碼組成。(Lijun Yin等) BioID面部數(shù)據(jù)庫(BioID組) BioVid熱痛數(shù)據(jù)庫?- 這個視頻(和生物醫(yī)學(xué)信號)數(shù)據(jù)集包含受試驗(yàn)誘發(fā)的熱痛的87名研究參與者的面部和生理心理反應(yīng)(馬格德堡大學(xué)(神經(jīng)信息技術(shù)組)和烏爾姆大學(xué)(情緒實(shí)驗(yàn)室) ) 生物識別數(shù)據(jù)庫?- 與虹膜識別相關(guān)的生物識別數(shù)據(jù)庫(Adam Czajka) Biwi 3D視聽情感語料庫?- 1000個高質(zhì)量,動態(tài)的面部3D掃描,同時發(fā)布一套英文句子。 博斯普魯斯3D / 2D數(shù)據(jù)庫的FACS注釋面部表情,頭部姿勢和面部遮擋(Bogazici大學(xué)) 漫畫/ Photomates數(shù)據(jù)集?- 具有正面和相應(yīng)漫畫線圖的數(shù)據(jù)集(Tayfun Akgul) CASIA-IrisV3(中國科學(xué)院,TN Tan,Z. Sun) CASIR凝視估計(jì)數(shù)據(jù)庫?- RGB和深度圖像(來自Kinect V1.0)和面部特征的地面真值相對于注視估計(jì)基準(zhǔn)的實(shí)驗(yàn):(Filipe Ferreira等) CMU面部表情數(shù)據(jù)庫(CMU / MIT) CMU姿勢,照明和表達(dá)(PIE)數(shù)據(jù)庫(Simon Baker) CMU / MIT正面(CMU / MIT) CMU / MIT正面(CMU / MIT) CSSE面部正面強(qiáng)度和范圍圖像(Ajmal Mian) CelebA?- 大型CelebFaces屬性數(shù)據(jù)集(Ziwei Liu,Ping Luo,Xiaogang Wang,Xiaoou Tang) Cohn-Kanade AU編碼表達(dá)數(shù)據(jù)庫?- 由激活的動作單元(Affect Analysis Group,Univ。of Pittsburgh)編碼的100+個受試者的500+表達(dá)序列 Cohn-Kanade AU編碼表達(dá)數(shù)據(jù)庫?- 用于自動面部圖像分析和綜合以及感知研究的研究(Jeff Cohn等人) 哥倫比亞凝視數(shù)據(jù)集?- 5,880張超過5頭姿勢的56人的圖像和21個凝視方向(Brian A. Smith,Qi Yin,Steven K. Feiner,Shree K. Nayar) 計(jì)算機(jī)視覺實(shí)驗(yàn)室面部數(shù)據(jù)庫(CVL面部數(shù)據(jù)庫)?- 數(shù)據(jù)庫包含114個人的798張圖像,每人7張圖像,可免費(fèi)提供研究用途(Peter Peer等) DISFA +:自發(fā)面部動作數(shù)據(jù)庫的擴(kuò)展丹佛強(qiáng)度?- DISFA(MH Mahoor)的擴(kuò)展 DISFA:自發(fā)面部動作數(shù)據(jù)庫的丹佛強(qiáng)度?- 一個非擬人?臉部表情數(shù)據(jù)庫,用于開發(fā)自動動作單元檢測的計(jì)算機(jī)算法以及由FACS描述的強(qiáng)度的人員。(MH Mahoor) EURECOM面部化妝品數(shù)據(jù)庫?- 389張圖片,50個/不含化妝品,關(guān)于應(yīng)用化妝品的數(shù)量和位置的注釋(Jean-Luc DUGELAY等) EURECOM Kinect面部數(shù)據(jù)庫?- 52人,2次會議,9個變化,6個面部地標(biāo)(Jean-Luc DUGELAY等) EYEDIAP數(shù)據(jù)集?- EYEDIAP數(shù)據(jù)集設(shè)計(jì)用于訓(xùn)練和評估RGB和RGB-D數(shù)據(jù)的注視估計(jì)算法。它包含參與者的多樣性,頭部姿勢,注視目標(biāo)和感測條件(Kenneth Funes和Jean-Marc Odobez) FDDB:面部檢測數(shù)據(jù)集和基準(zhǔn) - 學(xué)習(xí)無約束面部檢測(馬薩諸塞大學(xué)計(jì)算機(jī)視覺實(shí)驗(yàn)室) FG-Net老齡化不同年齡人臉(手勢識別研究網(wǎng)絡(luò)) 面部識別大挑戰(zhàn)數(shù)據(jù)集(FRVT - 面部識別供應(yīng)商測試) 面部超分辨率數(shù)據(jù)集?- 地面實(shí)況使用雙攝像頭設(shè)置拍攝的HR-LR臉部圖像(Chengchao Qu等) FaceScrub?- 一個擁有超過100,000張臉型的數(shù)據(jù)集,530人(男性和女性50:50)(H.-W. Ng,S. Winkler) FaceTracer數(shù)據(jù)庫 - 15,000面(Neeraj Kumar,PN Belhumeur和SK Nayar) 面部表情數(shù)據(jù)集?- 該數(shù)據(jù)集由現(xiàn)實(shí)世界條件下記錄的242張面部視頻(168,359幀)組成。(Daniel McDuff等人) 面部識別技術(shù)(FERET)數(shù)據(jù)庫(美國國家標(biāo)準(zhǔn)與技術(shù)研究所) 漢娜和她的姐妹數(shù)據(jù)庫?- 一個密集的視聽人物面孔,語言段,拍攝邊界的地面真理注釋(Patrick Perez,Technicolor) 香港臉譜數(shù)據(jù)庫 IDIAP頭部姿勢數(shù)據(jù)庫(IHPD)?- 數(shù)據(jù)集包含一組會議視頻以及個人參與者的頭部基礎(chǔ)(約128分鐘)(Sileye Ba和Jean-Marc Odobez) IMDB-WIKI?- 具有年齡和性別標(biāo)簽的500k +臉部圖像(Rasmus Rothe,Radu Timofte,Luc Van Gool) 印度電影面孔數(shù)據(jù)庫(IMFDB)?- 一個大型無約束的臉部數(shù)據(jù)庫,包含從100多個視頻(Vijay Kumar和CV Jawahar)收集的100位印度演員的34512張圖像, 伊朗面部數(shù)據(jù)庫?- IFDB是中東第一個圖像數(shù)據(jù)庫,包含年齡,姿勢和表情的彩色面部圖像,其主題在2-85范圍內(nèi)。(Mohammad Mahdi Dehshibi) 日本女性面部表情(JAFFE)數(shù)據(jù)庫(Michael J. Lyons) LFW:在野外標(biāo)記的面孔?- 無約束的臉部識別 麻省理工學(xué)院CBCL人臉識別數(shù)據(jù)庫(生物與計(jì)算學(xué)習(xí)中心) 麻省理工學(xué)院面部數(shù)據(jù)庫整理(Ethan Meyers) MIT眼睛跟蹤數(shù)據(jù)庫(1003圖像)(Judd等人) MMI面部表情數(shù)據(jù)庫?- 2900個視頻和75個主題的高分辨率靜態(tài)圖像,注釋為FACS AU。 MORPH(顱面縱向形態(tài)面部數(shù)據(jù)庫)(北卡羅來納州威爾明頓大學(xué)) MPIIGaze數(shù)據(jù)集?- 在不同照明條件和自然頭部運(yùn)動下,具有眼睛圖像和注視目標(biāo)的213,659個樣本,在日常使用期間從15名參與者收集筆記本電腦。(Xucong Zhang,Yusuke Sugano,Mario Fritz,Andreas Bulling) 曼徹斯特注釋會話視頻數(shù)據(jù)集(Timothy Cootes) MegaFace?- 100萬面孔在邊框(Kemelmacher-Shlizerman,Seitz,Nech,Miller,Brossard) 音樂視頻數(shù)據(jù)集?- 來自YouTube的8個音樂視頻,用于在無約束環(huán)境中開發(fā)多面部跟蹤算法(Shang Zhang,Jia-Bin Huang,Ming-Hsuan Yang) NIST面部識別大挑戰(zhàn)(FRGC)(NIST) NIST mugshot識別數(shù)據(jù)庫(美國國家標(biāo)準(zhǔn)與技術(shù)研究所) NRC-IIT面部視頻數(shù)據(jù)庫?- 該數(shù)據(jù)庫包含一對短視頻剪輯,每個視頻剪輯顯示坐在顯示器前面的計(jì)算機(jī)用戶的臉,表現(xiàn)出廣泛的面部表情和方向(Dmitry Gorodnichy) 圣母瑪利亞圖像數(shù)據(jù)集(Patrick J. Flynn) 巴黎圣母院的臉,紅臉,3D臉,表情,人群和眼睛生物特征數(shù)據(jù)集(巴黎圣母院) ORL面部數(shù)據(jù)庫:40人有10個意見(ATT劍橋?qū)嶒?yàn)室) OUI-Adience Faces?- 未過濾的面部,用于性別和年齡分類以及3D臉部(OUI) 牛津:臉,花,多視圖,建筑物,物體類別,運(yùn)動分割,仿射協(xié)變區(qū)域,雜項(xiàng)(牛津視覺幾何組) PubFig:公眾人臉數(shù)據(jù)庫(Neeraj Kumar,Alexander C. Berg,Peter N. Belhumeur和Shree K. Nayar) 重新標(biāo)記在野外的臉?- 原始圖像,但使用“深漏斗”方法對齊。(馬薩諸塞大學(xué),阿默斯特) SCface?- 監(jiān)控?cái)z像機(jī)面部數(shù)據(jù)庫(Mislav Grgic,Kresimir Delac,Sonja Grgic,Bozidar Klimpak)) 人類視覺輸入的注視對齊記錄的顯著特征?- 人類注視 - 野外數(shù)據(jù)的結(jié)核(Frank Schumann等) SiblingsDB?- SiblingsDB包含兩個描述與兄弟關(guān)系相關(guān)的個人圖像的數(shù)據(jù)集。(都靈視覺/計(jì)算機(jī)圖形與視覺組) CMU Multi-PIE Face數(shù)據(jù)庫?- 超過75萬張337人的影像,記錄在五個月的四個會議期間。(Jeff Cohn等人) UNBC-McMaster肩痛表達(dá)檔案數(shù)據(jù)庫?- 痛苦的數(shù)據(jù):UNBC-McMaster肩痛癥狀表達(dá)檔案數(shù)據(jù)庫(Lucy等) 特隆赫姆Kinect RGB-D人重新識別數(shù)據(jù)集(Igor Barros Barbosa) UB KinFace數(shù)據(jù)庫?- 布法羅大學(xué)親屬驗(yàn)證和識別數(shù)據(jù)庫 UBIRIS:嘈雜可見波長虹膜圖像數(shù)據(jù)庫(貝拉大學(xué)) UTIRIS交叉光圈虹膜圖像數(shù)據(jù)庫(Mahdi Hosseini) VIPSL數(shù)據(jù)庫?- VIPSL數(shù)據(jù)庫用于面部素描 - 照片合成和識別的研究,包括200個科目(每張科目1張照片和5張素描)(王南南) 華盛頓面部表情數(shù)據(jù)庫(FERG-DB))?- 具有7個注釋面部表情的6個風(fēng)格化(Maya)角色的數(shù)據(jù)庫(Deepali Aneja,Alex Colburn,Gary Faigin,Linda Shapiro和Barbara Mones) 寬面:臉部檢測基準(zhǔn)?- 32,203張有393,703張貼面的圖像,61個事件班(Shuo Yang,Ping Luo,Chen Change Loy,Xiaoou Tang) XM2VTS面部視頻序列(295):擴(kuò)展的M2VTS數(shù)據(jù)庫(XM2VTS) -(薩里大學(xué)) 耶魯臉數(shù)據(jù)庫 - 10人的11個表達(dá)(A. Georghaides) 耶魯臉數(shù)據(jù)庫B - 576人觀看條件(A. Georghaides) 約克大學(xué)眼睛跟蹤數(shù)據(jù)集(120圖像)(Neil Bruce) YouTube Faces DB?- 3,425個視頻,1,595個不同的人。(Wolf,Hassner,Maoz) 蘇黎世自然圖像?- 用于在一系列眼睛跟蹤研究中創(chuàng)建自然刺激的圖像材料(Frey等人) 指紋 FVC指紋驗(yàn)證競賽2002數(shù)據(jù)集(博洛尼亞大學(xué)) FVC指紋驗(yàn)證競賽2004數(shù)據(jù)集(博洛尼亞大學(xué)) 指紋手冊明細(xì)標(biāo)記(FM3)數(shù)據(jù)庫:?- 指紋手冊細(xì)節(jié)標(biāo)記(FM3)數(shù)據(jù)庫(Mehmet Kayaoglu,Berkay Topcu和Umut Uludag) NIST指紋數(shù)據(jù)庫(美國國家標(biāo)準(zhǔn)與技術(shù)研究所) SPD2010指紋單點(diǎn)檢測比賽(SPD 2010委員會) 一般圖像 用于實(shí)際低光圖像降噪的數(shù)據(jù)集?- 它包含由低光照相機(jī)噪聲和低噪聲對應(yīng)物損壞的像素和強(qiáng)度對齊的圖像對。(J.Anaya,A.Barbu) 與Vincent van Gogh相關(guān)的繪畫數(shù)據(jù)庫?- 這是為“從印象派到表現(xiàn)主義:自動識別梵高的繪畫”(Guilherme Folego和Otavio Gomes and Anderson Rocha)的論文VGDB-2016, AMOS:許多戶外場景的檔案(20 + m)(Nathan Jacobs) 空中圖像使用不變顏色特征和陰影信息從空間圖像構(gòu)建檢測(Beril Sirmacek) BGU自然場景的高光譜圖像數(shù)據(jù)庫(Ohad Ben-Shahar and Boaz Arad) 布朗大二進(jìn)制圖像數(shù)據(jù)庫(Ben Kimia) CMP門面數(shù)據(jù)庫?- 包括606個修正的外墻圖像,具有12個建筑類別的地方(Radim Tylecek) Caltech-UCSD鳥類200-2011(凱瑟琳華) 哥倫比亞多光譜圖像數(shù)據(jù)庫(F. Yasuma,T. Mitsunaga,D. Iso和SK Nayar) DAQUAR(視覺圖靈挑戰(zhàn))?- 包含有關(guān)真實(shí)室內(nèi)場景的問題和答案的數(shù)據(jù)集(Mateusz Malinowski,Mario Fritz) 美國電影預(yù)告片的數(shù)據(jù)集2010-2014?- 包含474份好萊塢電影預(yù)告片的鏈接以及相關(guān)的元數(shù)據(jù)(類型,預(yù)算,運(yùn)行時,版本,MPAA評分,發(fā)布的屏幕,續(xù)集指標(biāo))(USC信號分析和解釋實(shí)驗(yàn)室) 一般100數(shù)據(jù)集?- General-100數(shù)據(jù)集包含100個bmp格式的圖像(無壓縮),非常適合超分辨率訓(xùn)練(Dong,Chao和Loy,Chen Change和Tang,Xiaoou) HIPR2圖像不同類型圖像的目錄(Bob Fisher等) 用于自然場景中局部照明的空間分布的高光譜圖像?-?自然場景的三十個校準(zhǔn)的高光譜輻射圖像,用于局部照明估計(jì)的探針球。(Nascimento,Amano&Foster) 自然場景的高光譜圖像 - 2002(David H. Foster) 自然場景的高光譜圖像 - 2004(David H. Foster) ISPRS多平臺攝影測量數(shù)據(jù)集?- 1)天底和斜面航空圖像加2)組合無人機(jī)和陸地圖像(Francesco Nex和Markus Gerke) LIVE的圖像和視頻質(zhì)量評估?- 用于開發(fā)圖像質(zhì)量算法(德克薩斯大學(xué)奧斯汀分校) ImageNet大型視覺識別挑戰(zhàn)?- 目前有200個對象類和500 + K圖像(Alex Berg,Jia Deng,Fei-Fei Li等) ImageNet語言組織(WordNet)分層圖像數(shù)據(jù)庫 - 10E7圖像,15K類(李飛飛,賈登,郝蘇,凱麗) 改進(jìn)的3D稀疏映射用于具有低成本全向機(jī)器人的運(yùn)動的高性能結(jié)構(gòu) - 評估數(shù)據(jù)集?- 研究論文中使用的數(shù)據(jù)集doi:10.1109 / ICIP.2015.7351744(Breckon,Toby P.,Cavestany,Pedro) LabelMeFacade數(shù)據(jù)庫?- 945標(biāo)簽的建筑圖像(Erik Rodner等) 局部照明超光譜輻射圖像?- 具有嵌入式探針球的自然場景的三十個高光譜輻射圖像用于局部照度估計(jì)(Sgio MC Nascimento,Kinjiro Amano,David H.Foster) 麥吉爾校準(zhǔn)彩色圖像數(shù)據(jù)庫(Adriana Olmos和Fred Kingdom) 乘以扭曲圖像數(shù)據(jù)庫?- 用于評估多重扭曲圖像的圖像質(zhì)量評估指標(biāo)的結(jié)果的數(shù)據(jù)庫(費(fèi)周) NPRgeneral?- 用于評估圖像風(fēng)格化算法的圖像的標(biāo)準(zhǔn)化集合。(David Mold,Paul Rosin) 紐約大學(xué)對稱數(shù)據(jù)庫?- 176個單對稱和63個多對稱圖像(Marcelo Cicconet和Davi Geiger) OTCBVS熱成像基準(zhǔn)數(shù)據(jù)集收集(俄亥俄州立團(tuán)隊(duì)) PAnorama稀疏結(jié)構(gòu)區(qū)數(shù)據(jù)集?- 用于評估圖像對齊的PASSTA數(shù)據(jù)集(Andreas Robinson) 自然場景的超時光高光譜圖像 - 一天中采用的自然場景的7-9個校準(zhǔn)高光譜輻射圖像的四個延時序列。(Foster,DH,Amano,K.,&Nascimento,SMC) 延時高光譜輻射圖像?- 自然場景的7-9個校準(zhǔn)高光譜圖像的四個延時序列,10 nm間隔的光譜(David H. Foster,Kinjiro Amano,Sgio MC Nascimento) 微圖像數(shù)據(jù)集?79萬32x32彩色圖像(Fergus,Torralba,Freeman) 視覺問題回答?- 254K imags,764K問題,地面實(shí)況(Agrawal,Lu,Antol,Mitchell,Zitnick,Batra,Parikh) 視覺問題生成?- 15k圖像(包括以對象為中心和以事件為中心的圖像),有75k個自然問題涉及可以引起進(jìn)一步交談的圖像(Nasrin Mostafazadeh,Ishan Misra,Jacob Devlin,Margaret Mitchell,Xiao Dong He,Lucy Vanderwende ) YFCC100M:多媒體研究中的新數(shù)據(jù)?- 這個公開的1百萬張照片和視頻的策劃數(shù)據(jù)集是免費(fèi)的,所有人都是合法的(Bart ThomeeYahoo Labs和Flickr在舊金山等) 一般RGBD和深度數(shù)據(jù)集 注意:在其他地方也有3D數(shù)據(jù)集,例如在?對象,場景和動作中。
3D打印RGB-D對象數(shù)據(jù)集?- 5個具有g(shù)roundtruth CAD模型和攝像機(jī)軌跡的對象,采用各種高質(zhì)量的RGB-D傳感器(Siemens&TUM) 3DCOMET?- 3DCOMET是一種用于測試3D數(shù)據(jù)壓縮方法的數(shù)據(jù)集(Miguel Cazorla,Javier Navarrete,Vicente Morell,Miguel Cazorla,Diego Viejo,Jose Garcia-Rodriguez,Sergio Orts) 用于從RGB-D數(shù)據(jù)進(jìn)行非剛性重建的數(shù)據(jù)集 - 用于從RGB-D數(shù)據(jù)重建非剛性幾何的八個場景,每個都包含數(shù)百個幀以及我們的結(jié)果。(Matthias Innmann,Michael Zollhoefer,Matthias Niessner,Christian Theobalt,Marc Stamminger) 對象掃描的大數(shù)據(jù)集?- 39個對象在9個卡斯,每個數(shù)百幀(崔,周,米勒,科爾屯) 鉸接對象挑戰(zhàn)?- 由1D旋轉(zhuǎn)和棱柱連接連接的鉆石部件組成的4個關(guān)節(jié)物體,具有6D姿態(tài)估計(jì)注釋的7000+ RGBD圖像(Frank Michel,Alexander Krull,Eric Brachmann,Michael Y.Yang,Stefan Gumhold,Carsten Rother ) BigBIRD?- 每個對象有100個對象,600個3D點(diǎn)云和600個高分辨率彩色圖像,涵蓋所有視圖(Singh,Sha,Narayan,Achim,Abbeel) CAESAR平民美國和歐洲表面人體測量資源項(xiàng)目 - 4000 3D人體掃描(SAE國際) CIN 2D + 3D對象分類數(shù)據(jù)集?- 來自18個類別的普通家庭和辦公室對象的對象的分段顏色和深度圖像(Bj?rn Browatzki等) CoRBS?- 一個RGB-D SLAM基準(zhǔn)測試,提供真實(shí)深度和顏色數(shù)據(jù)的組合以及相機(jī)的地面真實(shí)軌跡和場景的地面真相3D模型(Oliver Wasenmuller) CTU服裝折疊照片數(shù)據(jù)集?- 衣服折疊各個階段的色彩和深度圖像(Sushkov R.,Melkumov I.,Smutn y V.(捷克技術(shù)大學(xué)在布拉格)) CTU服裝分類數(shù)據(jù)集?- 服裝圖像數(shù)據(jù)集,詳細(xì)的立體圖像,深度圖像和重量(Petrik V.,Wagner L.(捷克技術(shù)大學(xué)在布拉格)) 服裝零件數(shù)據(jù)集?- 服裝零件數(shù)據(jù)集包括用Kinect獲取的圖像和深度掃描,鋪設(shè)在桌子上的服裝,使用多邊形面具超過一千個注釋(領(lǐng),袖口,罩等)(Arnau Ramisa, Guillem Aleny,Francesc Moreno-Noguer和Carme Torras) 康奈爾RGBD數(shù)據(jù)集?- 辦公場景(Hema Koppula) 代爾夫特風(fēng)車內(nèi)部和外部激光掃描點(diǎn)云?- (Beril Sirmacek) EURECOM Kinect面部數(shù)據(jù)庫?- 52人,2次會議,9個變化,6個面部地標(biāo)(Jean-Luc DUGELAY等) EURECOM Kinect面部數(shù)據(jù)庫?- 52人,2次會議,9個變化,6個面部地標(biāo)(Jean-Luc DUGELAY等) G4S元房?- RGB-D數(shù)據(jù)150掃描每掃描18幅圖像。(John Folkesson等人) Goldfinch:GOOGLe圖像搜索精細(xì)粒子數(shù)據(jù)集 - 精細(xì)的鳥類(11K種類),蝴蝶(14K種),飛機(jī)(409種)和狗(515種)識別的大規(guī)模數(shù)據(jù)集(Jonathan Krause,Benjamin Sapp, Andrew Howard,Howard Zhou,Alexander Toshev,Tom Duerig,James Philbin,Li Fei-Fei) IMPART多視圖/多模態(tài)2D + 3D電影制作數(shù)據(jù)集?- LIDAR,視頻,3D模型,球形相機(jī),RGBD,立體聲,動作,面部表情等(薩里大學(xué)) Kinect v2數(shù)據(jù)集?- 使用內(nèi)核密度估計(jì)的高效多頻相位展開(Felix等) McGill-Reparti人工感知數(shù)據(jù)庫?- 來自四個攝像機(jī)的RGBD數(shù)據(jù)和兩個人類對象的未過濾的Vicon骨架數(shù)據(jù),在車門上執(zhí)行模擬裝配任務(wù)(Andrew Phan,Olivier St-Martin Cormier,Denis Ouellet,Frank P. Ferrie)。 元間房?- RGB-D數(shù)據(jù)由28個對準(zhǔn)的深度相機(jī)圖像組成,通過使機(jī)器人進(jìn)入特定位置并以各種傾斜進(jìn)行360度的平移而收集。(John Folkesson等人) MHT RGB-D?- 由林肯大學(xué)在16天內(nèi)每5分鐘由機(jī)器人收集。(John Folkesson等人) 用于具有全姿態(tài)估計(jì)的對象識別的多傳感器3D對象數(shù)據(jù)集 - 用于對象識別和姿勢估計(jì)的多傳感器3D對象數(shù)據(jù)集(Alberto Garcia-Garcia,Sergio Orts-Escolano,Sergiu Oprea等) NTU RGB + D動作識別數(shù)據(jù)集?- NTU RGB + D是人類行動識別的大規(guī)模數(shù)據(jù)集(Amir Shahroudy) NYU深度數(shù)據(jù)集V2?- RGBD圖像的室內(nèi)分割和支持推理 奧克蘭3點(diǎn)云數(shù)據(jù)集(Nicolas Vandapel) Pacman項(xiàng)目?- 來自20個課程的400個對象的合成RGB-D圖像。由3D網(wǎng)格模型生成(Vladislav Kramarev,Umit Rusen Aktas,Jeremy L. Wyatt。) SceneNN:場景網(wǎng)格數(shù)據(jù)集,帶有NNotations?- 具有100多個室內(nèi)場景的RGB-D場景數(shù)據(jù)集,標(biāo)記為三角形網(wǎng)格,體素和像素。(Hua,Pham,Nguyen,Tran,Yu和Yeung) 語義8:8類三維點(diǎn)云分類(蘇黎世蘇黎世科技大學(xué)) 小型辦公室數(shù)據(jù)集?- 從2014年4月開始每5秒鐘運(yùn)行一次Kinect深度圖像,并持續(xù)進(jìn)行。(John Folkesson等人) 具有實(shí)況的立體聲和ToF數(shù)據(jù)集?- 數(shù)據(jù)集包含采用飛行時間傳感器和立體聲設(shè)置獲取的5種不同場景。還提供了地面真相信息(Carlo Dal Mutto,Pietro Zanuttigh,Guido M. Cortelazzo) SYNTHIA?- 大型(約五十萬)虛擬世界圖像,用于訓(xùn)練自主車輛。(計(jì)算機(jī)視覺中心的ADAS集團(tuán)) TUM RGB-D基準(zhǔn)?- 用于評估RGB-D視覺測距和SLAM算法的數(shù)據(jù)集和基準(zhǔn)(BCrgen Sturm,Nikolas Engelhard,Felix Endres,Wolfram Burgard和Daniel Cremers) UC-3D運(yùn)動數(shù)據(jù)庫?- 可用的數(shù)據(jù)類型包括采用Xsens和Microsoft Kinect RGB和深度圖像的MVN Suit采集的高分辨率運(yùn)動捕捉(葡萄牙科英布拉系統(tǒng)與機(jī)器人研究所) USF范圍圖像數(shù)據(jù)庫?- 400+激光測距儀和結(jié)構(gòu)光照相機(jī)圖像,許多具有地面真實(shí)分割(Adam et al。) 華盛頓RGB-D對象數(shù)據(jù)集?- 300個普通家庭對象和14個場景。(華盛頓大學(xué)和英特爾實(shí)驗(yàn)室西雅圖) Witham碼頭?- 對于由林肯大學(xué)在10天內(nèi)每10分鐘由機(jī)器人收集的8個地點(diǎn)的RGB-D。(John Folkesson等人) 一般視頻 AlignMNIST?- 人工擴(kuò)展版本的MNIST手寫數(shù)據(jù)集。(恩·豪伯格) DAVIS:視頻對象分割數(shù)據(jù)集?- 密集注釋的VIdeo分割(F.Perazzi,J.Pont-Tuset,B.McWilliams,L.VanGol,M.Gross和A.Sorkine-Hornung,SC Prat) GoPro-Gyro數(shù)據(jù)集?- 以自我為中心的視頻(Linkoping Computer Vision Laboratory) LIVE的圖像和視頻質(zhì)量評估?- 用于開發(fā)圖像質(zhì)量算法(德克薩斯大學(xué)奧斯汀分校) 大型YouTube視頻數(shù)據(jù)集?- 從YouTube視頻(易陽)抓取的156,823個視頻(2,907,447個關(guān)鍵幀) MovieQA?- 每臺機(jī)器通過回答有關(guān)他們的問題來了解故事。15000多項(xiàng)選擇QAs,400多部電影(M。Tapaswi,Y. Zhu,R. Stiefelhagen,A. Torralba,R. Urtasun和S. Fidler) 多光譜可見NIR視頻序列?- 注釋多光譜視頻,可見+ NIR(LE2I,布爾戈尼大學(xué)) Sports-1M?- 體育視頻分類數(shù)據(jù)集,包含487類和1.2M影片(Andrej Karpathy和George Toderici,Sanketh Shetty,Thomas Leung,Rahul Sukthankar和Li Fei-Fei)。 視頻序列用于基于對相機(jī)的最小假設(shè)(Kenton McHenry)的歐幾里德升級研究 視頻堆疊數(shù)據(jù)集?- 手機(jī)視頻堆疊在智能手機(jī)上的虛擬三腳架(Erik Ringaby等) YFCC100M視頻?- YFCC100M的視頻子集的基準(zhǔn),包括視頻,他的視頻內(nèi)容功能和API到最先進(jìn)的視頻內(nèi)容引擎(Lu Jiang) YFCC100M:多媒體研究中的新數(shù)據(jù)?- 這個公開的1百萬張照片和視頻的策劃數(shù)據(jù)集是免費(fèi)的,所有人都是合法的(Bart Thomee,Yahoo Labs和Flickr在舊金山等) YouTube-8M?- 野外視頻分類的數(shù)據(jù)集,包含8M視頻和4800課程的預(yù)提取幀級功能(Sami Abu-El-Haija,Nisarg Kothari,Joonseok Lee,Paul Natsev,George Toderici,Balakrishnan Varadarajan, Sudheendra Vijayanarasimhan) YouTube-8M數(shù)據(jù)集?- 視頻理解研究(Google Inc.)的大型多樣化標(biāo)簽視頻數(shù)據(jù)集 手,掌握,手動和手勢數(shù)據(jù)庫 單眼圖像的3D鉸接手姿態(tài)估計(jì)(Tang,Chang,Tejani,Kim,Yu) 人機(jī)操作數(shù)據(jù)集?- 25對象和6動作的RGB-D(Alessandro Pieropan) 手勢檢測數(shù)據(jù)集(Javier Molina等) A-STAR注釋手深圖像數(shù)據(jù)及其性能評估?- 深度數(shù)據(jù)和數(shù)據(jù)手套數(shù)據(jù),30位志愿者,中文號碼和美國手語(徐和成)的29張圖像, Bosphorus手幾何數(shù)據(jù)庫和手靜脈數(shù)據(jù)庫(Bogazici大學(xué)) EgoHands?- 一個大型數(shù)據(jù)集,擁有超過15,000個像素級分割的手從相互交互的人的自我中心攝像頭記錄下來。(Sven Bambach) FORTH手跟蹤庫(FORTH) 一般手冊:一般手??檢和姿勢挑戰(zhàn)?- 22個不同手勢,活動和觀點(diǎn)的序列(UC Irvine) 掌握不確定(GUN-71)數(shù)據(jù)集?- 使用71個細(xì)粒度抓圖的分類法注釋的物體操縱場景的12,000個第一人稱RGB-D圖像(Rogez,Supancic和Ramanan) 手勢和海洋剪影(Euripides GM Petrakis) HandNet:鉸接手的注釋深度圖像214971由手姿勢的RealSense RGBD傳感器捕獲的手的注釋深度圖像。注釋:每像素類,6D指尖姿勢,熱圖。圖片 - >火車:202198,測試:10000,驗(yàn)證:2773.記錄在GIP實(shí)驗(yàn)室,Technion。 IDIAP手姿勢/手勢數(shù)據(jù)集(Sebastien Marcel) Kinect和Leap運(yùn)動手勢識別數(shù)據(jù)集?- 數(shù)據(jù)集包含與Leap Motion和Kinect設(shè)備一起獲得的1400種不同手勢(Giulio Marin,Fabio Dominio,Pietro Zanuttigh) Kinect和Leap運(yùn)動手勢識別數(shù)據(jù)集?- 數(shù)據(jù)集包含使用Creative Senz3D攝像頭獲取的幾種不同的靜態(tài)手勢(A。Memo,L. Minto,P. Zanuttigh) LISA CVRR-HANDS 3D?- 由8名作為汽車司機(jī)和乘客(Ohn-Bar和Trivedi)執(zhí)行的19個手勢 LISA車輛檢測數(shù)據(jù)集?- 在各種照明和交通條件下駕駛視頻的顏色第一人稱(Sivaraman,Trivedi) MPI Dexter 1用于3D關(guān)節(jié)手運(yùn)動跟蹤評估的數(shù)據(jù)集?- Dexter 1:7具有挑戰(zhàn)性,緩慢和快速手動運(yùn)動的序列,RGB +深度(Sridhar,Oulasvirta,Theobalt) MSR實(shí)時和可靠的深度跟蹤?- (錢,孫,魏,唐,孫) 手機(jī)和網(wǎng)絡(luò)攝像頭手圖像數(shù)據(jù)庫?- MOHI和WEHI - 200人,每張30張(Ahmad Hassanat) 紐約大學(xué)手勢數(shù)據(jù)集?- 8252測試集和72757訓(xùn)練集幀捕獲的RGBD數(shù)據(jù)與地面真相手勢,3視圖(湯普森,斯坦因,萊昆,佩林) Sahand動態(tài)手勢數(shù)據(jù)庫?- 該數(shù)據(jù)庫包含11種動態(tài)手勢,旨在傳達(dá)鼠標(biāo)和觸摸屏功能到計(jì)算機(jī)(Behnam Maleki,Hossein Ebrahimnezhad) 謝菲爾德手勢數(shù)據(jù)庫?- 2160 RGBD手勢序列,6個科目,10個手勢,3個姿勢,3個背景,2個照明(Ling Shao) UT掌握數(shù)據(jù)集?- 4個對象用各種掌握抓住各種對象(蔡,北谷,佐藤) 耶魯人類掌握數(shù)據(jù)集?- 27小時視頻,帶有標(biāo)記的抓握,對象和任務(wù)數(shù)據(jù),來自兩位管家和兩名機(jī)械師(Bullock,Feix,Dollar) 圖像,視頻和形狀數(shù)據(jù)庫檢索 ANN_SIFT1M?- 由128D SIFT描述符編碼的1M Flickr圖像(Jegou等) Brown Univ 25/99/216形狀數(shù)據(jù)庫(Ben Kimia) 來自10個類的CIFAR-10?- 60K 32x32圖像,512D GIST描述符(Alex Krizhevsky) CLEF-IP 2011專利圖像評估 結(jié)構(gòu)查詢和空間關(guān)系的數(shù)據(jù)集 - 關(guān)于圖像的結(jié)構(gòu)化查詢的數(shù)據(jù)集,強(qiáng)調(diào)空間關(guān)系(Mateusz Malinowski,Mario Fritz) DeepFashion?- 大型時尚數(shù)據(jù)庫(劉紫偉,平羅,石秋,王小剛王曉棠) EMODB?- picsearch圖像搜索引擎中的圖像縮略圖以及picsearch情感關(guān)鍵詞(Reiner Lenz等) ETU10剪影數(shù)據(jù)集?- 數(shù)據(jù)集由10個對象的720個剪影組成,每個對象有72個視圖(M。Akimaliev和MF Demirci) 魚形數(shù)據(jù)庫?- 它是一個魚形數(shù)據(jù)庫,具有100,2D點(diǎn)集的形狀。(Adrian M. Peter) Flickr 30K?- 圖像,動作和標(biāo)題(Peter Young等) Flickr15k - 基于草圖的圖像檢索(SBIR)基準(zhǔn)?- 330個草圖和15,024張照片的數(shù)據(jù)集,包括33個對象類別,通常用于評估基于草圖的圖像檢索(SBIR)算法的基準(zhǔn)數(shù)據(jù)集(Hu and Collomosse,CVIU 2013) IAPR TC-12圖像基準(zhǔn)(Michael Grubinger) IAPR-TC12分段和注釋圖像基準(zhǔn)測試(SAIAPR TC-12):(?Hugo Jair Escalante) ImageCLEF 2010概念檢測和注釋任務(wù)(Stefanie Nowak) ImageCLEF 2011概念檢測和注釋任務(wù)?- Flickr照片中的多標(biāo)簽分類挑戰(zhàn) METU商標(biāo)數(shù)據(jù)集?METU數(shù)據(jù)集由全球超過900K個真實(shí)標(biāo)志組成。(Usta Bilgi Sistemleri AS和Grup Ofis Marka專利AS) MPI電影描述數(shù)據(jù)集 - 文本和視頻(A. Rohrbach) 麥吉爾3D形狀基準(zhǔn)(Siddiqi,Zhang,Macrini,Shokoufandeh,Bouix,Dickinson) 多視覺立體聲評估?- 每個數(shù)據(jù)集通過激光掃描過程獲得的“地面真相”3D模型進(jìn)行注冊(Steve Seitz等) NIST SHREC - 其他NIST檢索比賽數(shù)據(jù)庫和鏈接(美國國家標(biāo)準(zhǔn)與技術(shù)研究所) NIST SHREC 2010 - 非剛性3D模型的形狀檢索比賽(美國國家標(biāo)準(zhǔn)與技術(shù)研究所) NIST TREC視頻檢索評估數(shù)據(jù)庫(美國國家標(biāo)準(zhǔn)與技術(shù)研究所) NUS-WIDE?- 269K Flickr圖像用81個概念標(biāo)簽注釋,作為500D BoVW描述符加密等等) 普林斯頓形狀基準(zhǔn)(Princeton Shape Retrieval and Analysis Group) 昆士蘭跨媒體數(shù)據(jù)集?- 數(shù)百萬圖像和文本文件,用于“跨媒體”檢索(易陽) TOSCA 3D形狀數(shù)據(jù)庫(Bronstein,Bronstein,Kimmel) YouTube-8M數(shù)據(jù)集?- 視頻理解研究(Google Inc.)的大型多樣化標(biāo)簽視頻數(shù)據(jù)集 對象數(shù)據(jù)庫 2.5D / 3D各種對象和場景的數(shù)據(jù)集(Ajmal Mian) 3D對象識別立體數(shù)據(jù)集該數(shù)據(jù)集由9個對象和80個測試圖像組成。(Akash Kushal和Jean Ponce) 3D攝影數(shù)據(jù)集是我們實(shí)驗(yàn)室(Yasutaka Furukawa和Jean Ponce)收集的十個多視圖數(shù)據(jù)集的集合, 3D打印RGB-D對象數(shù)據(jù)集?- 5個具有g(shù)roundtruth CAD模型和攝像機(jī)軌跡的對象,采用各種高質(zhì)量的RGB-D傳感器(Siemens&TUM) 3DNet數(shù)據(jù)集?- 3DNet數(shù)據(jù)集是從點(diǎn)云數(shù)據(jù)中獲取對象類識別和6DOF姿態(tài)估計(jì)的免費(fèi)資源。(John Folkesson等人) 阿姆斯特丹對象圖書館(ALOI):1K物體的100K視圖(阿姆斯特丹大學(xué)/智能感官信息系統(tǒng)) B3DO:伯克利3-D對象數(shù)據(jù)集?- 家庭對象檢測(Janoch等人) 超越PASCAL:野外3D對象檢測的基準(zhǔn)?- 12個類,每個具有3D注釋的3000多個圖像(Yu Xiang,Roozbeh Mottaghi,Silvio Savarese) 布里斯托爾中心對象交互數(shù)據(jù)集?- 與同心目的的自我中心對象交互(Dima Damen) CORE圖像數(shù)據(jù)集?- 幫助學(xué)習(xí)更詳細(xì)的模型和探索對象識別中的跨類別泛化。(Ali Farhadi,Ian Endres,Derek Hoiem和David A. Forsyth) 傳播服裝的CTU顏色和深度圖像數(shù)據(jù)?- 具有注釋角落的散布服裝的圖像(Wagner,L.,Krejov D.,Smutn V.(捷克技術(shù)大學(xué)在布拉格)) Caltech 101(現(xiàn)256)類別對象識別數(shù)據(jù)庫(李飛飛,Marco Andreeto,Marc’Aurelio Ranzato) 卡塔尼亞魚類物種識別?- 15種魚類,約20,000個樣本訓(xùn)練圖像和附加測試圖像(Concetto Spampinato)) 哥倫比亞COIL-100 3D對象多視圖(哥倫比亞大學(xué)) 密集抽樣對象視圖:2500個視圖的2個對象,例如基于視圖的識別和建模(Gabriele Peters,Universiteit Dortmund) EDUB-Obj?- 用于對象定位和分割的Egocentric數(shù)據(jù)集(MarcBola?os和Petia Radeva。) 橢圓查找數(shù)據(jù)集(Dilip K. Prasad等) GDXray:用于X射線測試和計(jì)算機(jī)視覺的X射線圖像?- GDXray包括五組圖像:鑄件,焊縫,行李,自然和設(shè)置。(智利天主教大學(xué)Domingo Mery) GRAZ-02數(shù)據(jù)庫(自行車,汽車,人)(A. Pinz) GTSDB:德國交通標(biāo)志檢測基準(zhǔn)(Ruhr-Universitat Bochum) ICubWorld?- iCubWorld數(shù)據(jù)集是通過從iCub類人形機(jī)器人的攝像機(jī)記錄而收集的圖像,同時觀察日常物體(Giulia Pasquale,Carlo Ciliberto,Giorgio Metta,Lorenzo Natale,Francesca Odone和Lorenzo Rosasco)。 關(guān)鍵點(diǎn)5數(shù)據(jù)集?- 具有二維關(guān)鍵點(diǎn)標(biāo)簽的五種家具數(shù)據(jù)集(吳嘉鈞,田天凡,約瑟夫·林,田東田,何塞·Tenenbaum,安東尼奧·托拉爾巴,比爾·弗里曼) KTH-3D-TOTAL?- RGB-D數(shù)據(jù)與桌面上的對象注釋。20個書桌,每天3次,超過19天。(John Folkesson等人) LISA交通信號燈數(shù)據(jù)集?- 各種照明條件下的6種燈光類(Jensen,Philipsen,Mogelmose,Moeslund和Trivedi) LISA交通標(biāo)志數(shù)據(jù)集?- 在6610幀(Mogelmose,Trivedi和Moeslund)上的47個美國標(biāo)志類型的視頻,7855個注釋 Linkoping 3D對象姿勢估計(jì)數(shù)據(jù)庫(Fredrik Viksten和Per-Erik Forssen) Linkoping交通標(biāo)志數(shù)據(jù)集?- 2088張圖像中的3488個交通標(biāo)志(Larsson和Felsberg) Longterm Labeled?- 此數(shù)據(jù)集包含來自longterm數(shù)據(jù)集(上述longterm數(shù)據(jù)集)的觀察數(shù)據(jù)的一部分。(John Folkesson等人) 麻省理工學(xué)院CBCL汽車數(shù)據(jù)(生物和計(jì)算學(xué)習(xí)中心) 麻省理工學(xué)院CBCL StreetScenes挑戰(zhàn)框架:(Stan Bileschi) Microsoft COCO?- 上下文中的常見對象(Tsung-Yi Lin et al) Microsoft對象類識別圖像數(shù)據(jù)庫(Antonio Criminisi,Pushmeet Kohli,Tom Minka,Carsten Rother,Toby Sharp,Jamie Shotton,John Winn) 微軟突出對象數(shù)據(jù)庫(由邊界框標(biāo)注)(劉,孫正,唐,舒) ModelNet?- 127,915 CAD模型,662對象類別,10個具有注釋方向的類別(Wu,Song,Khosla,Yu,Zhang,Tang,Xiao) 移動Labled?- 此數(shù)據(jù)集在KTH的同一辦公環(huán)境中擴(kuò)展了更多位置的longterm數(shù)據(jù)集。(John Folkesson等人) NABirds數(shù)據(jù)集?- 北美通常觀察到的400種鳥類的70,000張注釋照片(Grant Van Horn) NEC玩具動物識別或分類數(shù)據(jù)庫(Hossein Mobahi) NORB 50玩具圖像數(shù)據(jù)庫(NYU) NTU-VOI:NTU視頻對象實(shí)例數(shù)據(jù)集?- 具有用于評估大型視頻中的對象實(shí)例搜索和本地化的對象實(shí)例的幀級邊界框注釋的視頻剪輯(Jingjing Meng等人) 對象姿勢估計(jì)數(shù)據(jù)庫?- 該數(shù)據(jù)庫包含16個對象,每個對象以兩個旋轉(zhuǎn)軸(F. Viksten等)以5度角增量進(jìn)行采樣, 對象識別數(shù)據(jù)庫該數(shù)據(jù)庫具有8個對象的建模鏡頭和包含多個對象的51個雜亂的測試鏡頭(Fred Rothganger,Svetlana Lazebnik,Cordelia Schmid和Jean Ponce) PacMan數(shù)據(jù)集?- 用于可抓取的炊具和陶器的RGB和3D合成和實(shí)際數(shù)據(jù)(Jeremy Wyatt) PASCAL 2007挑戰(zhàn)圖像數(shù)據(jù)庫(摩托車,汽車,奶牛)(PASCAL聯(lián)盟) PASCAL 2008挑戰(zhàn)圖像數(shù)據(jù)庫(PASCAL Consortium) PASCAL 2009挑戰(zhàn)圖像數(shù)據(jù)庫(PASCAL聯(lián)盟) PASCAL 2010挑戰(zhàn)圖像數(shù)據(jù)庫(PASCAL聯(lián)盟) PASCAL 2011挑戰(zhàn)圖像數(shù)據(jù)庫(PASCAL聯(lián)盟) PASCAL 2012挑戰(zhàn)圖像數(shù)據(jù)庫類別分類,檢測和分割以及靜態(tài)圖像動作分類(PASCAL Consortium) PASCAL圖像數(shù)據(jù)庫(摩托車,汽車,奶牛)(PASCAL Consortium) PASCAL零件數(shù)據(jù)集?- PASCAL VOC與物體語義部分的分割注釋(Alan Yuille) PASCAL-Context數(shù)據(jù)集?- 400多個附加類別的注釋(Alan Yuille) 物理101數(shù)據(jù)集?- 五種不同場景中的101種物體的視頻數(shù)據(jù)集(Jiajun Wu,Joseph Lim,Hongyi Zhang,Josh Tenenbaum,Bill Freeman) 雨滴檢測?- 使用組合形狀和顯著性描述符與場景背景隔離改進(jìn)的雨滴檢測 - 評估數(shù)據(jù)集(Breckon,Toby P.,Webster,Dereck D.) 瑞典葉數(shù)據(jù)集?- 這些圖像包含15個treeclasses的葉子(Oskar JO S?derkvist) T-LESS?- 用于6D姿勢估計(jì)無紋理對象的RGB-D數(shù)據(jù)集(Tomas Hodan,Pavel Haluza,Stepan Obdrzalek,Jiri Matas,Manolis Lourakis,Xenophon Zabulis) TUW對象實(shí)例識別數(shù)據(jù)集?- 從各種觀點(diǎn)觀察并表示為Kinect RGB-D點(diǎn)云的對象實(shí)例及其6DoF姿態(tài)對于混亂室內(nèi)場景的注釋(Thomas,A. Aldoma,M.Zillich,M.Vincze) TUW數(shù)據(jù)集?-?TUW的幾個RGB-D地面真值和注釋數(shù)據(jù)集。(John Folkesson等人) UAH交通標(biāo)志數(shù)據(jù)集(Arroyo等) UIUC汽車影像數(shù)據(jù)庫(UIUC) UIUC數(shù)據(jù)集3D對象類別(S. Savarese和L. Fei-Fei) 威尼斯3D對象在雜波識別和分割(Emanuele Rodola) 可視屬性數(shù)據(jù)集超過500個對象類(動畫和無生命)的視覺屬性注釋,都在ImageNet中表示。每個對象類都基于具有636個屬性的分類法(例如,具有金屬制成的毛皮,圓形)的視覺屬性來注釋。 視覺基因組:使用群眾密集圖像注釋連接語言和視覺?- 視覺基因組是一個數(shù)據(jù)集,知識庫,持續(xù)的將結(jié)構(gòu)化圖像概念與語言連接的努力(Ranjay Krishna,Yuke Zhu,Oliver Groth,Justin Johnson,Kenji Hata, Joshua Kravitz,Stephanie Chen,Yannis Kalantidis,Li Jia-Li,David Ayman Shamma,Michael Bernstrein,Li Fei-Fei) 視覺船體數(shù)據(jù)設(shè)置一組視覺船體數(shù)據(jù)集(Svetlana Lazebnik,Yasutaka Furukawa和Jean Ponce) 人(靜),人體姿勢 在電影院標(biāo)記的幀(?FLIC?)?- 標(biāo)有人體姿勢的20928幀(Sapp,Taskar) 利茲體育姿勢數(shù)據(jù)集?- 2000姿態(tài)大多數(shù)體育運(yùn)動人物的注釋圖像(約翰遜,永恒) MPII人體姿態(tài)數(shù)據(jù)集?- 25K幅圖像,包含超過40K個具有注釋的身體關(guān)節(jié)的人物,410人類活動{Andriluka,Pishchulin,Gehler,Schiele) MPII人體姿態(tài)數(shù)據(jù)集?- MPII人體姿勢數(shù)據(jù)集是用于評估關(guān)節(jié)人臉姿態(tài)估計(jì)的事實(shí)上的標(biāo)準(zhǔn)基準(zhǔn)。(Mykhaylo Andriluka,Leonid Pishchulin,Peter Gehler,Bernt Schiele) 人物相冊?- 社會媒體照片數(shù)據(jù)集與Flickr的圖像,手動注釋的人頭和他們的身份(寧張和Manohar Paluri和Yaniv泰格曼和Rob Fergus和Lubomir Bourdev) 個人照片集中的人物識別?- 我們?yōu)樵u估和長時間屬性注釋和每張照片時間戳元數(shù)據(jù)引入了三個更難的劃分(噢,Seong Joon和Benenson,Rodrigo和Fritz,Mario和Schiele,Bernt) 指點(diǎn)’04 ICPR車間頭姿圖數(shù)據(jù)庫 UC-3D運(yùn)動數(shù)據(jù)庫?- 可用的數(shù)據(jù)類型包括采用Xsens和Microsoft Kinect RGB和深度圖像的MVN Suit采集的高分辨率運(yùn)動捕捉(葡萄牙科英布拉系統(tǒng)與機(jī)器人研究所) VGG人體姿態(tài)估計(jì)數(shù)據(jù)集,包括BBC姿勢(20個視頻與重疊的手語翻譯),擴(kuò)展BBC姿勢(72個額外的訓(xùn)練視頻),短BBC姿勢(5個1小時視頻與手語簽名者)和ChaLearn姿勢(23小時的Kinect數(shù)據(jù)27人執(zhí)行20意大利手勢)。(Charles,Everingham,Pfister,Magee,Hogg,Simonyan,Zisserman) 人員檢測和跟蹤數(shù)據(jù)庫 3D KINECT性別步行數(shù)據(jù)庫(L。Igual,A. Lapedriza,R. Borrà s來自UB,CVC和UOC,西班牙) AGORASET:人群視頻分析數(shù)據(jù)集(Nicolas Courty等) CASIA步態(tài)數(shù)據(jù)庫(中國科學(xué)院) CAVIAR項(xiàng)目視頻序列跟蹤和行為基礎(chǔ)真相(CAVIAR團(tuán)隊(duì)/愛丁堡大學(xué) - EC項(xiàng)目IST-2001-37540) CMU?Panoptic?Studio數(shù)據(jù)集?- 由500多臺同步攝像機(jī)捕獲的多人社交互動數(shù)據(jù)集,具有3D全身骨骼和校準(zhǔn)數(shù)據(jù)。(H. Joo,T. Simon,Y. Sheikh) 大眾人群數(shù)據(jù)集?- 來自215個擁擠場景的474個視頻片段(邵,洛和王) CUHK01數(shù)據(jù)集:具有3,884個行人圖像的人員重新編號數(shù)據(jù)集(Rui Zhao等人) CUHK02數(shù)據(jù)集:具有五個攝像機(jī)視圖設(shè)置的人員重新編號數(shù)據(jù)集。(Rui Zhao et al) CUHK03數(shù)據(jù)集:擁有1,360名行人13,164張圖像的人物重新編號數(shù)據(jù)集(芮釗等) Caltech行人數(shù)據(jù)集(P. Dollar,C.Wojek,B.Schiele和P. Perona) 戴姆勒行人檢測基準(zhǔn)?21790圖像與56492行人和空場景(DM Gavrila等人) 驅(qū)動程序監(jiān)控視頻數(shù)據(jù)集(RobeSafe + Jesus Nuevo-Chiquero) DukeMTMC:杜克多目標(biāo)多攝像機(jī)跟蹤數(shù)據(jù)集?- 8個攝像頭,85分鐘,2米幀,2000人視頻(Ergys Ristani,Francesco Solera,Roger S. Zou,Rita Cucchiara,Carlo Tomasi) 愛丁堡高架攝像頭人物跟蹤數(shù)據(jù)集(Bob Fisher,Bashia Majecka,Gurkirt Singh,Rowland Sillito) GVVPerfcapEva?- 人體形態(tài)和性能捕獲數(shù)據(jù)庫,包括全身骨骼,手跟蹤,身體形態(tài),面部表現(xiàn),交互(Christian Theobalt) HAT數(shù)據(jù)庫的27個人類屬性(Gaurav Sharma,Frederic Jurie) INRIA人物數(shù)據(jù)集(Navneet Dalal) 即時數(shù)據(jù)集?- 此數(shù)據(jù)集專為估計(jì)個人關(guān)系而設(shè)計(jì)。(Xiao Chu et al。) Inria運(yùn)動基準(zhǔn)的穿戴式人體?- 包含不同主題,運(yùn)動和服裝風(fēng)格的3D運(yùn)動序列的基準(zhǔn)測試,可以定量測量身體形狀估計(jì)的準(zhǔn)確性(Jinlong Yang,Jean-Sbastien Franco,Franck H = E9troy-Wheeler,和Stefanie Wuhrer) 伊茲密爾(Izmir)?- 用于人類和汽車檢測(Yalin Bastanlar)的全向和全景圖像數(shù)據(jù)集(帶注釋) 自主駕駛(JAAD)的共同關(guān)注?- 數(shù)據(jù)集包括主要用于在自主駕駛中進(jìn)行行為研究和檢測的行人和汽車的實(shí)例(Iuliia Kotseruba,Amir Rasouli和John K. Tsotsos) MAHNOB:MHI-Mimicry數(shù)據(jù)庫?- 一個2人,多個攝像頭和麥克風(fēng)數(shù)據(jù)庫,用于在人與人之間的交互場景中學(xué)習(xí)模擬。(Sun,Lichtenauer,Valstar,Nijholt和Pantic) MIT CBCL行人數(shù)據(jù)(生物與計(jì)算學(xué)習(xí)中心) MPI DYNA?- 動態(tài)人形運(yùn)動模型(Max Planck Tubingen) MPI FAUST數(shù)據(jù)集包含300個真實(shí),高分辨率人類掃描的數(shù)據(jù)集,具有自動計(jì)算的地面真相對應(yīng)關(guān)系(Max Planck Tubingen) MPI JHMDB數(shù)據(jù)集?- 聯(lián)合注釋的人體運(yùn)動數(shù)據(jù)庫 - 21個動作,928個剪輯,33183幀(Jhuang,Gall,Zuffi,Schmid和Black) MPI MOSH運(yùn)動和形狀捕捉從標(biāo)記。MOCAP數(shù)據(jù),3D形狀網(wǎng)格,3D高分辨率掃描。(馬克斯·普朗克·圖賓根) MVHAUS-PI?- 一種多視角人類交互識別數(shù)據(jù)集(Saeid et al。) 市場1501數(shù)據(jù)集?- 最多6臺相機(jī)的1,501個身份的32,668個注釋邊界框(梁正等) 摩德納和雷焦艾米利亞第一人稱動議視頻(摩德納和雷焦艾米利亞大學(xué)) 日常生活的多式聯(lián)運(yùn)活動?- 包括視頻,音頻,生理,睡眠,運(yùn)動和插頭傳感器。(Alexia Briasouli) 多目標(biāo)跟蹤基準(zhǔn)?- 具有實(shí)地真相的數(shù)據(jù)集合,以及一個績效聯(lián)盟表(ETHZ,U. Adelaide,TU Darmstadt) 多光譜可見NIR視頻序列?- 注釋多光譜視頻,可見+ NIR(LE2I,布爾戈尼大學(xué)) 紐約大學(xué)多目標(biāo)跟蹤基準(zhǔn)(Konrad Schindler等) 閉合的人體數(shù)據(jù)集?- 身體姿勢提取和跟蹤在閉塞下,6個RGB-D序列(3500幀)與一個,兩個和三個用戶,基于標(biāo)記的地面真相數(shù)據(jù)(Markos Sigalas,Maria Pateraki,Panos Trahanias) PARSE數(shù)據(jù)集附加數(shù)據(jù)?- 面部表情,凝視方向和性別(Antol,Zitnick,Parikh) 鉸鏈機(jī)構(gòu)的PARSE數(shù)據(jù)集?- 300張人和馬的圖像(拉曼) PETS 2009 Crowd Challange數(shù)據(jù)集(Reading University& James Ferryman) PETS冬季2009年研討會數(shù)據(jù)(Reading University& James Ferryman) PETS:跟蹤和監(jiān)視的績效評估(Reading University& James Ferryman) PIROPO?- 具有透視和全向相機(jī)的室內(nèi)紅寶石的人員,擁有超過100,000個注釋框架(GTI-UPM,西班牙) 人民藝術(shù)?- 一張數(shù)據(jù)庫,內(nèi)含人物貼上照片和藝術(shù)作品(齊武和泓平蔡) Photo-Art-50?- 一個數(shù)據(jù)庫,包含照片和圖畫中標(biāo)注的50個對象類(Qi Wu and Hongping Cai) 基于像素的變化檢測基準(zhǔn)數(shù)據(jù)集(Goyette等) RADD?- 室內(nèi) - 室外數(shù)據(jù)集中的重新識別:43人,4臺攝像機(jī),6920張圖像(Abir Das等人) SYNTHIA?- 大型(約五十萬)虛擬世界圖像,用于訓(xùn)練自主車輛。(計(jì)算機(jī)視覺中心的ADAS集團(tuán)) Shinpuhkan 2014?- 一個人重新識別數(shù)據(jù)集,包含由16臺攝像機(jī)捕獲的24人的22,000張圖像。(Yasutomo Kawanishi等) 斯坦福結(jié)構(gòu)化集團(tuán)發(fā)現(xiàn)數(shù)據(jù)集?- 發(fā)現(xiàn)圖像中的人群(W. Choi等人) 寺廟顏色128 - 顏色跟蹤基準(zhǔn)?- 編碼用于視覺跟蹤的顏色信息(P.Liang,E.Blasch,H.Lin) 瞬態(tài)生物特征指甲數(shù)據(jù)集V01(Igor Barros Barbosa) 中佛羅里達(dá)大學(xué) - 人群數(shù)據(jù)集(Saad Ali) 中佛羅里達(dá)大學(xué) - 人群流分段數(shù)據(jù)集(Saad Ali) VIPeR:觀點(diǎn)不變行人識別?- 在不同照明條件下從任意視角拍攝的632個行人圖像對。(格雷,布倫南,陶) 視覺對象跟蹤挑戰(zhàn)數(shù)據(jù)集?- VOT數(shù)據(jù)集是在單目標(biāo)短期視覺對象跟蹤挑戰(zhàn)中使用的完全注釋的視覺對象跟蹤數(shù)據(jù)集的集合(VOT委員會) WIDER屬性數(shù)據(jù)集?- WIDER屬性是一個大規(guī)模的人類屬性數(shù)據(jù)集,其中13789個圖像屬于30個場景類別,每個57524個人體邊界框分別用14個二進(jìn)制屬性注釋(Li,Yining和Huang,Chen,Loy,Chen Change和唐,小ou) 遙感 巴西Cerrado-Savanna場景數(shù)據(jù)集?- 由巴西Cerrado-Savanna植被分類的RapidEye傳感器拍攝的IR-RG場景的組成。(K.Nogueira,JA dos Santos,T.Fornazari,TS Freire,LP Morellato,R.da S. Torres) 巴西咖啡場景數(shù)據(jù)集?- 由SPOT傳感器用于鑒定巴西山區(qū)咖啡作物的IR-RG場景的組成(OAB Penatti,K.Nogueira,JA dos Santos。) 從IKONOS(1米)和QuickBird(60厘米)(阿里Ozgun Ok和Caglar Senaras)獲取的建筑物檢測基準(zhǔn)?-14圖像 CBERS-2B,Landsat 5 TM,Geoeye,Ikonos-2 MS和ALOS-PALSAR?- 使用光學(xué)圖像的陸地覆蓋分類(D。Osaku等人) Furnas和Tiete?- 沉積物產(chǎn)量分類(Pisani等) ISPRS 2D語義標(biāo)簽?- 在波茨坦(德國波茨坦)市(Franz Rottensteiner,Gunho Sohn,Markus Gerke,Jan D. Wegner)準(zhǔn)備了距離為5cm的高度模型和真正的正像, ISPRS 3D語義標(biāo)注?- 九級機(jī)載激光掃描數(shù)據(jù)(Franz Rottensteiner,Gunho Sohn,Markus Gerke,Jan D. Wegner) 內(nèi)陸空中圖像標(biāo)簽數(shù)據(jù)集?- 美國和奧地利城市的9000平方公里的彩色航空影像。(Emmanuel Maggiori,Yuliya Tarabalka,Guillaume Charpiat,Pierre Alliez) Lampert的譜圖分析?- 來自時間序列數(shù)據(jù)的被動聲納譜圖,這些譜圖是從水下海洋記錄中從螺旋槳和發(fā)動機(jī)機(jī)械輻射的聲能的記錄產(chǎn)生的。(托馬斯·蘭珀特) Linkoping Thermal InfraRed數(shù)據(jù)集?- LTIR數(shù)據(jù)集是用于評估短期單對象(STSO)跟蹤的熱紅外數(shù)據(jù)集(Linkoping大學(xué)) MUUFL Gulfport高光譜和LiDAR數(shù)據(jù)集?- 在密西西比州南密西根海灣大學(xué)校園內(nèi)共同登記的航空高光譜和激光雷達(dá)數(shù)據(jù),其中包含幾個子像素目標(biāo)。(P.Gader,A.Zare,R.Light,J.Aitken,G.Touell) 蘇黎世夏季數(shù)據(jù)集旨在用于城市場景的非常高分辨率衛(wèi)星圖像的語義分割,具有不完整的地面實(shí)況(Michele Volpi和Vitto Ferrari。) 蘇黎世城市微型飛行器數(shù)據(jù)集?- 蘇黎世2公里的時間同步空中高分辨率圖像,以及相關(guān)的其他數(shù)據(jù)(Majdik,Till,Scaramuzza 場景分割或分類 巴塞羅那?- 15,150張圖片,巴塞羅那的城市景觀(Tighe和Lazebnik) CMU可視化本地化數(shù)據(jù)集?- 使用裝備有IMU,GPS,INS,激光雷達(dá)和相機(jī)的Navlab 11?收集的數(shù)據(jù)集(Hernan Badino,Daniel Huber和Takeo Kanade) COLD(舒適的本地化數(shù)據(jù)庫) - 本地化(Ullah,Pronobis,Caputo,Luo和Jensfelt) DAVIS:視頻對象分割數(shù)據(jù)集?- 密集注釋的VIdeo分割(F. Perazzi,J.Pont-Tuset,B. McWilliams,L.VanGol,M.Gross和A.Sorkine-Hornung) EDUB-Seg?- 用于事件分割的Egocentric數(shù)據(jù)集(Mariella Dimiccoli,MarcBola?os,Estefania Talavera,Maedeh Aghaei,Stavri G. Nikolov和Petia Radeva。) 十五個場景分類十五個自然場景類別的數(shù)據(jù)集(Fei-Fei Li和Aude Oliva) 幾何背景 - 場景解釋圖像(Derek Hoiem) 移動機(jī)器人本地化的室內(nèi)地點(diǎn)識別數(shù)據(jù)集?- 該數(shù)據(jù)集包含由兩個不同機(jī)器人(virtualMe和先鋒)構(gòu)建的17個不同的地方(Raghavender Sahdev,John K. Tsotsos)。 室內(nèi)場景識別?- 67室內(nèi)類別,15620圖像(Quattoni和Torralba) 野外的本質(zhì)圖像(IIW)?- 野外的內(nèi)在圖像是一個大型的公共數(shù)據(jù)集,用于評估室內(nèi)場景的內(nèi)在圖像分解(Sean Bell,Kavita Bala,Noah Snavely) LM + SUN?- 45,676幅圖像,主要是城市或人類相關(guān)場景(Tighe和Lazebnik) 可視和紅外光譜中的海事影像?- VAIS包含從碼頭獲得的船舶的同時獲取的未注冊的熱和可見圖像(Zhang,MM,Choi,J.,Daniilidis,K.,Wolf,MT&Kanan) 上下文中的材料(MINC)?- 上下文數(shù)據(jù)庫中的材料(MINC)建立在OpenSurfaces上,但包括數(shù)百萬個材料標(biāo)簽的點(diǎn)注釋。(Sean Bell,Paul Upchurch,Noah Snavely,Kavita Bala) 麻省理工學(xué)院內(nèi)在圖像?- 20件物品(羅杰格羅斯,米卡·約翰遜,愛德華·阿德爾森和威廉·弗里曼) NYU V2混合曼哈頓框架數(shù)據(jù)集?- 我們提供曼哈頓框架(MMF)分割和MF旋轉(zhuǎn)的混合物在全面的NYU深度數(shù)據(jù)集V2由Silberman等人。(Straub,Julian和Rosman,Guy和Freifeld,Oren和Leonard,John J.和Fisher III,John W.) OpenSurfaces?- OpenSurfaces由數(shù)以萬計(jì)的內(nèi)部消費(fèi)者照片分割的曲面示例組成,并用材質(zhì)參數(shù),紋理信息和上下文信息進(jìn)行注釋。(Kavita Bala等人) 場景2場景識別數(shù)據(jù)庫?-365場景類別和800萬圖像(周,Khosla,Lapedriza,Torralba和Oliva) 場景識別數(shù)據(jù)庫?- 205個場景類別和250萬個圖像(Zhou,Lapedriza,Xiao,Torralba和Oliva) RGB-NIR場景數(shù)據(jù)集?- 在RGB和近紅外(NIR)(Brown和Susstrunk)中捕獲的9個類別中的477個圖像 SUN 2012?- 16,873場景分類完全注釋場景圖像(Xiao等) SUN 397?- 397場景分類場景類別(Xiao等) SUN RGB-D:RGB-D場景了解基準(zhǔn)套件?- 10,000 RGB-D圖像,146,617 2D多邊形和58,657 3D邊框(Song,Lichtenberg和Xiao) SYNTHIA?- 大型(約五十萬)虛擬世界圖像,用于訓(xùn)練自主車輛。(計(jì)算機(jī)視覺中心的ADAS集團(tuán)) 篩選流程(也稱為LabelMe Outdoor,LMO)?- 2688幅圖像,主要是戶外自然和城市(Tighe和Lazebnik) 斯坦福背景數(shù)據(jù)集?- 包含至少一個前景物體的戶外場景的715幅圖像(Gould等人) 表面檢測?- 通過顏色空間融合和時間分析的實(shí)時可行表面檢測 - 評估數(shù)據(jù)集(Breckon,Toby P.,Katramados,Ioannis) ViDRILO?- ViDRILO是一個數(shù)據(jù)集,其中包含5個帶有注釋的RGB-D圖像序列,該圖像采用移動機(jī)器人在兩個辦公樓內(nèi),具有挑戰(zhàn)性的照明條件(Miguel Cazorla,J。Martinez-Gomez,M. Cazorla,I. Garcia-Varea和V莫雷爾) 細(xì)分(一般) :陰影檢測/紋理分割計(jì)算機(jī)視覺數(shù)據(jù)集?- 基于視頻的陰影檢測/抑制序列,具有實(shí)例(Newey,C.,Jones,O.,&Dee,HM) Aberystwyth葉評估數(shù)據(jù)集?- 用手標(biāo)記植物圖像,用手標(biāo)記一段時間的葉級分割,以及植物犧牲的生物數(shù)據(jù)。(Bell,Jonathan; Dee,Hannah M.) Alpert等人 分段評估數(shù)據(jù)庫(Sharon Alpert,Meirav Galun,Ronen Basri,Achi Brandt) BMC(背景模型挑戰(zhàn))?- 用于比較背景減法算法的數(shù)據(jù)集,實(shí)際和合成視頻(Antoine) 伯克利分割數(shù)據(jù)集和基準(zhǔn)測試(David Martin和Charless Fowlkes) 傳播服裝的CTU顏色和深度圖像數(shù)據(jù)?- 具有注釋角落的散布服裝的圖像(Wagner,L.,Krejov D.,Smutn V.(捷克技術(shù)大學(xué)在布拉格)) CTU服裝折疊照片數(shù)據(jù)集?- 衣服折疊各個階段的色彩和深度圖像(Sushkov R.,Melkumov I.,Smutn y V.(捷克技術(shù)大學(xué)在布拉格)) DeformIt 2.0?- 圖像數(shù)據(jù)增強(qiáng)工具:從單個圖像分割對(Brian Booth和Ghassan Hamarneh)模擬具有地面真實(shí)分割的新穎圖像 GrabCut圖像數(shù)據(jù)庫(C.Rother,V.Kolmogorov,A.Blake,M.Brown) 野外的本質(zhì)圖像(IIW)?- 野外的內(nèi)在圖像是一個大型的公共數(shù)據(jù)集,用于評估室內(nèi)場景的內(nèi)在圖像分解(Sean Bell,Kavita Bala,Noah Snavely) LabelMe圖像數(shù)據(jù)庫和在線注釋工具(Bryan Russell,Antonio Torralba,Kevin Murphy,William Freeman) 上下文中的材料(MINC)?- 上下文數(shù)據(jù)庫中的材料(MINC)建立在OpenSurfaces上,但包括數(shù)百萬個材料標(biāo)簽的點(diǎn)注釋。(Sean Bell,Paul Upchurch,Noah Snavely,Kavita Bala) OpenSurfaces?- OpenSurfaces由數(shù)以萬計(jì)的內(nèi)部消費(fèi)者照片分割的曲面示例組成,并用材質(zhì)參數(shù),紋理信息和上下文信息進(jìn)行注釋。(Kavita Bala等人) PetroSurf3D?- 26高分辨率(亞毫米精度)巖石藝術(shù)的3D掃描與巖畫的像素標(biāo)記進(jìn)行分割(Poier,Seidl,Zeppelzauer,Reinbacher,Schaich,Bellandi,Marretta,Bischof) SYNTHIA?- 大型(約五十萬)虛擬世界圖像,用于訓(xùn)練自主車輛。(計(jì)算機(jī)視覺中心的ADAS集團(tuán)) 石溪大學(xué)陰影數(shù)據(jù)集(SBU-Shadow5k)?- 來自各種場景和照片類型的大型影像檢測數(shù)據(jù)集,以及人體注釋(Tomas FY Vicente,Le Hou,Chen-Ping Yu,Minh Hoai,Dimitris Samaras) 同時本地化和映射 姿態(tài)估計(jì),視覺測??距和SLAM的基于事件的數(shù)據(jù)數(shù)據(jù)還包括來自運(yùn)動捕捉系統(tǒng)的強(qiáng)度圖像,慣性測量和地面實(shí)況。(ETH) RAWSEEDS SLAM基準(zhǔn)數(shù)據(jù)集(Rawseeds Project) TUM RGB-D基準(zhǔn)?- 用于評估RGB-D視覺測距和SLAM算法的數(shù)據(jù)集和基準(zhǔn)(BCrgen Sturm,Nikolas Engelhard,Felix Endres,Wolfram Burgard和Daniel Cremers) 視覺測量/ SLAM評估?- 測距基準(zhǔn)由22個立體聲序列組成(Andreas Geiger和Philip Lenz和Raquel Urtasun) 監(jiān)視和跟蹤 ATOMIC GROUP ACTIONS數(shù)據(jù)集?- (Ricky J. Sethi等) AVSS07:基于高級視頻和信號的監(jiān)控2007數(shù)據(jù)集(Andrea Cavallaro) 活動建模和異常檢測數(shù)據(jù)集?- 數(shù)據(jù)集包含45分鐘視頻,帶有注釋異常(Jagan Varadarajan和Jean-Marc Odobez) 背景減法?- 關(guān)于背景減法的數(shù)據(jù)集列表(Thierry BOUWMANS) CMUSRD:監(jiān)控研究數(shù)據(jù)集?- 用于室內(nèi)監(jiān)控場景的多攝像機(jī)視頻(K.Hattori,H.Hattori等人) DukeMTMC:杜克多目標(biāo)多攝像機(jī)跟蹤數(shù)據(jù)集?- 8個攝像頭,85分鐘,2米幀,2000人視頻(Ergys Ristani,Francesco Solera,Roger S. Zou,Rita Cucchiara,Carlo Tomasi) ETISEO視頻監(jiān)控下載數(shù)據(jù)集(INRIA獵戶座等) HDA +多攝像機(jī)監(jiān)控?cái)?shù)據(jù)集?- 分布在研究所3層樓的1??8個異??質(zhì)攝像機(jī)網(wǎng)絡(luò)(不同分辨率和幀速率)的視頻,具有13個完全標(biāo)記的序列,85個人和64028個包圍的人。(D.Figueira,M.Taiana,A.Nambiar,J.Nascimento和A.Bernardino) 人類點(diǎn)擊數(shù)據(jù)?- 跟蹤目標(biāo)20K人的點(diǎn)擊(包括點(diǎn)擊錯誤)(Zhu和Porikli) 即時數(shù)據(jù)集?- 此數(shù)據(jù)集專為估計(jì)個人關(guān)系而設(shè)計(jì)。(Xiao Chu et al。) MAHNOB數(shù)據(jù)庫 - 包括笑聲數(shù)據(jù)庫,HCI標(biāo)簽數(shù)據(jù)庫,MHI模擬數(shù)據(jù)庫(M.Pantic等) MVHAUS-PI?- 一種多視角人類交互識別數(shù)據(jù)集(Saeid et al。) 多光譜可見NIR視頻序列?- 注釋多光譜視頻,可見+ NIR(LE2I,布爾戈尼大學(xué)) Openvisor - 視頻監(jiān)控在線存儲庫(摩德納和雷焦艾米利亞大學(xué)) 停車場數(shù)據(jù)集?- 停車場數(shù)據(jù)集是一個汽車數(shù)據(jù)集,專注于停車場情況下汽車的中度和重度遮擋(B。李,TF吳和SC Zhu) 色情數(shù)據(jù)庫?- 色情數(shù)據(jù)庫是一個色情檢測數(shù)據(jù)庫,包含從色情網(wǎng)站和Youtube中提取的近80個小時的400個色情和400個非色情視頻。(Avila,Thome,Cord,Valle,de Araujo) 普林斯頓跟蹤基準(zhǔn)?- 100個RGBD跟蹤數(shù)據(jù)集(Song and Xiao) 瑪麗瑪麗多相機(jī)分布式交通場景數(shù)據(jù)集(QMDTS)?- QMDTS是從城市監(jiān)控環(huán)境中收集的,用于研究分布式場景中的監(jiān)控行為(徐旭教授,邵剛教授和Timothy Hospedales博士) SALSA:協(xié)同社會場景分析?- 多模式群體行為分析的新型數(shù)據(jù)集(Xavier Alameda-Pineda等) SBMnet(場景背景建模.NET)?- 用于測試背景估計(jì)算法的數(shù)據(jù)集(Pierre-Marc Jodoin,Lucia Maddalena和Alfredo Petrosino) SCOUTER?- 視頻監(jiān)控場地實(shí)況(轉(zhuǎn)移觀點(diǎn),不同設(shè)置/照明條件,主題變化較大)。30個視頻和約36,000個手動標(biāo)記的幀。(Catalin Mitrea) SJTU-BEST一個監(jiān)視指定的數(shù)據(jù)集平臺,具有逼真的,使用相機(jī)的攝像頭,多樣化的監(jiān)控圖像和視頻(上海交通大學(xué)) SPEVI:監(jiān)督績效評估計(jì)劃(倫敦瑪麗皇后大學(xué)) Shinpuhkan 2014?- 一個人重新識別數(shù)據(jù)集,包含由16臺攝像機(jī)捕獲的24人的22,000張圖像。(Yasutomo Kawanishi等) 在極其混亂的場景中進(jìn)行跟蹤 - 這個單個對象跟蹤數(shù)據(jù)集具有28個高度混亂的序列,每幀注釋(Jingjing Xiao,Linbo Qiao,Rustam Stolkin,Ale Leonardis) UCSD異常檢測數(shù)據(jù)集?- 一個穩(wěn)定的攝像機(jī),安裝在海拔高度,俯瞰行人天橋,行人異常或非行人運(yùn)動。 UCSD軌跡聚類和分析數(shù)據(jù)集?- (Morris and Trivedi) USC信息科學(xué)研究所的ATOMIC PAIR ACTIONS數(shù)據(jù)集?- (Ricky J. Sethi等) Udine基于軌跡的異常事件檢測數(shù)據(jù)集?- 具有異常值的合成軌跡數(shù)據(jù)集(Udine人工視覺和實(shí)時系統(tǒng)實(shí)驗(yàn)室) 視覺跟蹤器基準(zhǔn)?- 100個跟蹤跟蹤序列,具有可視化跟蹤基準(zhǔn)評估的地面實(shí)況,包括跟蹤多個跟蹤器的跟蹤結(jié)果(Wu,Lim,Yang) WIDER屬性數(shù)據(jù)集?- WIDER屬性是一個大規(guī)模的人類屬性數(shù)據(jù)集,其中13789個圖像屬于30個場景類別,每個57524個人體邊界框分別用14個二進(jìn)制屬性注釋(Li,Yining和Huang,Chen,Loy,Chen Change和唐,小ou) 紋理 Brodatz紋理,規(guī)范化Brodatz紋理,彩色Brodatz紋理,Multiband Brodatz紋理?154新圖像加上112個具有各種變換的原始圖像(A. Safia,D. He) 顏色紋理圖像按類別(textures.forrest.cz) 哥倫比亞 - 烏特勒支反射和紋理數(shù)據(jù)庫(哥倫比亞特區(qū)和烏得勒支大學(xué)) DynTex:動態(tài)紋理數(shù)據(jù)庫(Renaud Piteri,Mark Huiskes和Sandor Fazekas) 野外的本質(zhì)圖像(IIW)?- 野外的內(nèi)在圖像是一個大型的公共數(shù)據(jù)集,用于評估室內(nèi)場景的內(nèi)在圖像分解(Sean Bell,Kavita Bala,Noah Snavely) KTH TIPS& TIPS2紋理?- 姿態(tài)/照明/刻度變化(Eric Hayman) 上下文中的材料(MINC)?- 上下文數(shù)據(jù)庫中的材料(MINC)建立在OpenSurfaces上,但包括數(shù)百萬個材料標(biāo)簽的點(diǎn)注釋。(Sean Bell,Paul Upchurch,Noah Snavely,Kavita Bala) OpenSurfaces?- OpenSurfaces由數(shù)以萬計(jì)的內(nèi)部消費(fèi)者照片分割的曲面示例組成,并用材質(zhì)參數(shù),紋理信息和上下文信息進(jìn)行注釋。(Kavita Bala等人) 奧盧紋理數(shù)據(jù)庫(奧盧大學(xué)) 牛津可描述的紋理數(shù)據(jù)集?- 5640個圖像(M.Cimpoi,S. Maji,I.Kokkinos,S.Mhhamed,A.Vedaldi) 布拉格紋理分割數(shù)據(jù)生成器和基準(zhǔn)測試(Mikes,Haindl) 薩爾斯堡紋理圖像數(shù)據(jù)庫(STex)?- 奧地利薩爾斯堡附近捕獲的大量476色紋理圖像。(羅蘭·克維特和彼得·梅爾瓦爾德) 紋理數(shù)據(jù)庫紋理數(shù)據(jù)庫具有25個紋理類,每個40個樣本(Svetlana Lazebnik,Cordelia Schmid和Jean Ponce) 表面和材料的烏普薩拉紋理數(shù)據(jù)集?- 織物,谷物等 視覺紋理(MIT Media Lab) 城市數(shù)據(jù)集 巴塞羅那?- 15,150張圖片,巴塞羅那的城市景觀(Tighe和Lazebnik) CMP門面數(shù)據(jù)庫?- 包括606個修正的外墻圖像,具有12個建筑類別的地方(Radim Tylecek) LM + SUN?- 45,676幅圖像,主要是城市或人類相關(guān)場景(Tighe和Lazebnik) 麻省理工學(xué)院CBCL StreetScenes挑戰(zhàn)框架:(Stan Bileschi) 瑪麗瑪麗多相機(jī)分布式交通場景數(shù)據(jù)集(QMDTS)?- QMDTS是從城市監(jiān)控環(huán)境中收集的,用于研究分布式場景中的監(jiān)控行為(徐旭教授,邵剛教授和Timothy Hospedales博士) 強(qiáng)大的全球翻譯與1DSfM數(shù)據(jù)數(shù)據(jù)描述每個數(shù)據(jù)集的運(yùn)動問題的全局結(jié)構(gòu)(凱爾威爾遜和挪亞Snavely) 篩選流程(也稱為LabelMe Outdoor,LMO)?- 2688幅圖像,主要是戶外自然和城市(Tighe和Lazebnik) 解卷積網(wǎng)絡(luò)的街景變化檢測?- 具有結(jié)構(gòu),照明,天氣和季節(jié)變化的街景圖像對齊圖像對的數(shù)據(jù)庫(Pablo F. Alcantarilla,Simon Stent,德國Ros,Roberto Arroyo和Riccardo Gherardi) 悉尼房屋?- 具有準(zhǔn)確3D房屋形狀,門面對象標(biāo)簽,密點(diǎn)對應(yīng)和注釋工具箱的街景房屋圖像(Hang Chu,Shenlong Wang,Raquel Urtasun,Sanja Fidler) 交通標(biāo)志數(shù)據(jù)集?- 記錄從瑞典高速公路和城市道路(Fredrik Larsson)350公里以上的序列 其他收藏 4D光場數(shù)據(jù)集?- 24個具有9x9x512x512x3輸入圖像的合成場景,深度和視差地面實(shí)況,攝像機(jī)參數(shù)和評估面具。(Katrin Honauer,Ole Johannsen,Daniel Kondermann,Bastian Goldluecke) AMADI_LontarSet?- 巴厘棕櫚葉手稿圖像二進(jìn)制數(shù)據(jù)集,查詢字典查找和孤立字符識別巴厘劇本。(AMADI項(xiàng)目等) 注釋的Web耳朵數(shù)據(jù)集(AWE數(shù)據(jù)集)?- 所有圖像都是通過從已知人員的互聯(lián)網(wǎng)上的圖像中刪除耳朵獲得的(Ziga Emersic,Vitomir Struc和Peter Peer) 生物特征評估與測試?- 識別技術(shù)的評估,包括生物識別(歐洲計(jì)算電子基礎(chǔ)設(shè)施) CALVIN研究組數(shù)據(jù)集?- 眼睛跟蹤對象檢測,imagenet邊界框,同步活動,stickman和身體姿勢,youtube對象,臉,馬,玩具,視覺屬性,形狀類(CALVIN ggroup) CANTATA視頻和圖像數(shù)據(jù)庫索引站點(diǎn)(Multitel) 香港中文大學(xué)數(shù)據(jù)集?- 面部素描,面部對齊,圖像搜索,公眾廣場觀察,閉塞,中心站,麻省理工學(xué)院單人和多人相機(jī)軌跡,人物重新識別(多媒體實(shí)驗(yàn)室) 計(jì)算機(jī)視覺測試圖像數(shù)據(jù)庫(Carnegie Mellon Univ)首頁列表 計(jì)算機(jī)視覺實(shí)驗(yàn)室OCR DataBase(CVL OCR DB)?- CVL OCR DB是一個公共注釋的圖像數(shù)據(jù)集,在自然場景中有120個二進(jìn)制注釋的文本圖像。(Andrej Ikica和Peter Peer) ETHZ各種,包括ETH 3D頭部姿勢,BIWI視聽數(shù)據(jù),ETHZ形狀類,BIWI步行者,行人,建筑物,4D MRI,個人事件,肝臟超聲,食物101(ETH蘇黎世,計(jì)算機(jī)視覺實(shí)驗(yàn)室) 一般100數(shù)據(jù)集?- General-100數(shù)據(jù)集包含100個bmp格式的圖像(無壓縮),非常適合超分辨率訓(xùn)練(Dong,Chao和Loy,Chen Change和Tang,Xiaoou) HKU-IS?-4447圖像與像素標(biāo)記的基礎(chǔ),用于突出物體檢測(Guanbin Li,Yizhou Yu) 高分辨率3D模型?- 它包括這些數(shù)據(jù)集的高分辨率渲染。(休伯特等) I3 - Yahoo Flickr Creative Commons 100M?- 此數(shù)據(jù)集包含照片和視頻列表。(B.Thomee,DAShamma,G.Friedland等人) IDIAP數(shù)據(jù)集集合?- 26個不同的數(shù)據(jù)集 - 多模式,攻擊,生物特征,草書人物,話語,眼睛凝視,海報(bào),瑪雅法典,MOBIO,面部欺騙,游戲,手指靜脈,YouTube個性特質(zhì)(IDIAP團(tuán)隊(duì)) Kinect v2數(shù)據(jù)集?- 用于評估kinect2深度解碼(Felix等)中的展開的數(shù)據(jù)集 拉瓦爾HDR天空數(shù)據(jù)庫?- 該數(shù)據(jù)庫包含800個半球形,全天空的HDR照片,可用于戶外照明分析。(Jean-Francois Lalonde等) Leibe的人物/車輛/物體數(shù)據(jù)庫(Bastian Leibe) 蓮山圖像數(shù)據(jù)庫收集與地面真相(Sealeen Ren,Benjamin Yao,Michael Yang) 麻省理工學(xué)院收入基準(zhǔn)數(shù)據(jù)集?- 收集(指向23個數(shù)據(jù)集)(Bylinskii,Judd,Borji,Itti,Durand,Oliva,Torralba} Michael Firman的RGBD數(shù)據(jù)集列表 Msspoof:2D多光譜臉部欺騙?- 使用紙張進(jìn)行NIR和VIS相機(jī)(Idiap研究所)的實(shí)時數(shù)據(jù)主體和欺騙性數(shù)據(jù)對象的演示攻擊(欺騙)數(shù)據(jù)集, 多視覺立體聲評估?- 每個數(shù)據(jù)集通過激光掃描過程獲得的“地面真相”3D模型進(jìn)行注冊(Steve Seitz等) 牛津雜項(xiàng),包括巴菲,鮮花,電視角色,建筑物等(牛津視覺幾何集團(tuán)) PEIPA圖像數(shù)據(jù)庫摘要(試點(diǎn)歐洲圖像處理歸檔) PalmVein欺騙?- 用紙(Idiap研究機(jī)構(gòu))執(zhí)行的來自欺騙性數(shù)據(jù)主題(對應(yīng)于VERA Palmvein)的示例的演示攻擊(欺騙)數(shù)據(jù)集 RSBA數(shù)據(jù)集?- 用于評估滾動快門束調(diào)整的順序(Per-Erik等) 重播攻擊:2D臉部欺騙?- 使用來自移動設(shè)備到筆記本電腦的紙張,照片和視頻執(zhí)行的真實(shí)數(shù)據(jù)主體和欺騙性數(shù)據(jù)主題的演示攻擊(欺騙)數(shù)據(jù)集(Idiap研究所) 重播手機(jī):2D臉部欺騙?- 使用來自移動設(shè)備的紙張,照片和視頻執(zhí)行的實(shí)時數(shù)據(jù)主體和欺騙性數(shù)據(jù)主題的演示攻擊(欺騙)數(shù)據(jù)集(Idiap研究所) 合成序列發(fā)生器?- 合成序列發(fā)生器(G. Hamarneh) 事件相機(jī)數(shù)據(jù)集?- 這是世界上第一個采用基于事件的高速機(jī)器人相機(jī)數(shù)據(jù)集合(E.Mueggler,H. Rebecq,G. Gallego,T. Delbruck,D.Scaramuzza) 從貓的角度看世界 - 從自由行為的貓頭上?錄制的視頻(Belinda Y.Betsch,Wolfgang Einh?user) USC注釋計(jì)算機(jī)視覺參考書目數(shù)據(jù)庫出版摘要(Keith Price) USC-SIPI圖像數(shù)據(jù)庫:紋理,空中,收藏(例如Lena)(USC信號和圖像處理研究所) 伯爾尼大學(xué)伯克利數(shù)據(jù)庫,在線文檔,字符串編輯和圖形匹配(伯恩大學(xué),計(jì)算機(jī)視覺和人工智能) VERA Fingervein欺騙?- 使用紙(Idiap研究所)執(zhí)行的來自欺騙性數(shù)據(jù)主題(對應(yīng)于VERA Fingervein)的樣本的演示攻擊(欺騙)數(shù)據(jù)集 VERA Fingervein?- 帶有數(shù)據(jù)主體的Fingervein數(shù)據(jù)集,用開放的fingervein傳感器記錄(Idiap研究所) VERA PalmVein:PalmVein?- Palmvein數(shù)據(jù)集,其中記錄有開放式掌紋傳感器(Idiap研究所)的數(shù)據(jù)主體 航空圖像中的車輛檢測?- VEDAI是航空影像中車輛檢測的數(shù)據(jù)集,作為在無約束環(huán)境中對自動目標(biāo)識別算法進(jìn)行基準(zhǔn)測試的工具。(Sebastien Razakarivony和Frederic Jurie) 視頻堆疊數(shù)據(jù)集?- 用于在手機(jī)上釋放視頻堆疊的數(shù)據(jù)集(Erik Ringaby等) 手腕攝像機(jī)視頻數(shù)據(jù)集?- 從腕上攝像頭和頭戴式攝像機(jī)拍攝的日常生活視頻活動(Katsunori Ohnishi,Atsushi Kanehira,Asako Kanezaki,Tatsuya Harada) Yummly-10k數(shù)據(jù)集?- 目標(biāo)是了解人類的感知,在這種情況下,食物味道相似。(SE(3)康乃爾科技計(jì)算機(jī)視覺集團(tuán)) 雜 3D網(wǎng)格水印基準(zhǔn)數(shù)據(jù)集(Guillaume Lavoue) 4D光場數(shù)據(jù)集?- 24個具有9x9x512x512x3輸入圖像的合成場景,深度和視差地面實(shí)況,攝像機(jī)參數(shù)和評估面具。(Katrin Honauer,Ole Johannsen,Daniel Kondermann,Bastian Goldluecke) 用于實(shí)際低光圖像降噪的數(shù)據(jù)集?- 它包含由低光照相機(jī)噪聲和低噪聲對應(yīng)物損壞的像素和強(qiáng)度對齊的圖像對。(J.Anaya,A.Barbu) AMADI_LontarSet?- 巴厘棕櫚葉手稿圖像二進(jìn)制數(shù)據(jù)集,查詢字典查找和孤立字符識別巴厘劇本。(AMADI項(xiàng)目等) 活動外觀模型數(shù)據(jù)集(Mikkel B. Stegmann) 飛機(jī)跟蹤(Ajmal Mian) 注釋的Web耳朵數(shù)據(jù)集(AWE數(shù)據(jù)集)?- 所有圖像都是通過從已知人員的互聯(lián)網(wǎng)上的圖像中刪除耳朵獲得的(Ziga Emersic,Vitomir Struc和Peter Peer) CITIUS視頻數(shù)據(jù)庫?- 具有眼睛跟蹤數(shù)據(jù)的72個視頻數(shù)據(jù)庫=用于評估動態(tài)顯眼視覺模型(Xose) CVSSP 3D數(shù)據(jù)存儲庫?- 數(shù)據(jù)集旨在評估一般的多視圖重建算法。(Armin Mustafa,Hansung Kim,Jean-Yves Guillemaut和Adrian Hilton) 加利福尼亞州 - ND?- 從個人照片集的701張照片,包括許多具有挑戰(zhàn)性的現(xiàn)實(shí)生活中不相同的近似重復(fù)(Vassilios Vonikakis) 基于劍橋運(yùn)動的分割和識別數(shù)據(jù)集(Brostow,Shotton,Fauqueur,Cipolla) 反折射相機(jī)校準(zhǔn)圖像(Yalin Bastanlar) Chars74K數(shù)據(jù)集 - 74個英語和卡納達(dá)角色(Teo de Campos - t.decampos@surrey.ac.uk) 硬幣圖像數(shù)據(jù)集?- 硬幣圖像數(shù)據(jù)集是60類羅馬共和國硬幣的數(shù)據(jù)集(Sebastian Zambanini,Klaus Vondrovec) 哥倫比亞相機(jī)響應(yīng)功能:數(shù)據(jù)庫(DoRF)和模型(EMOR)(MD Grossberg和SK Nayar) 哥倫比亞數(shù)據(jù)庫的污染物模式和散射參數(shù)(Jinwei Gu,Ravi Ramamoorthi,Peter Belhumeur,Shree Nayar) 犯罪現(xiàn)場鞋印象數(shù)據(jù)庫?- 犯罪現(xiàn)場和參考foorware印象圖像(Adam Kortylewski) D-HAZY?- 用于評估定量診斷算法的數(shù)據(jù)(Cosmin Ancuti et al。) DR(眼睛)VE?- 駕駛員注意力數(shù)據(jù)集(摩德納大學(xué)和雷焦艾米利亞大學(xué)) DTU控制運(yùn)動和照明圖像數(shù)據(jù)集(135K圖像)(Henrik Aanaes) 視覺眼動數(shù)據(jù)庫(DOVES)?- 從29個人類觀察者收集到的一組眼動,因?yàn)樗鼈冇^察到101個自然校準(zhǔn)圖像。(van der Linde,I.,Rajashekar,U.,Bovik,AC等) DeformIt 2.0?- 圖像數(shù)據(jù)增強(qiáng)工具:從單個圖像分割對(Brian Booth和Ghassan Hamarneh)模擬具有地面真實(shí)分割的新穎圖像 密集的戶外通信地面實(shí)況數(shù)據(jù)集,用于光流和局部關(guān)鍵點(diǎn)評估(Christoph Strecha) EISATS:.enpeda ..圖像序列分析測試站點(diǎn)(奧克蘭大學(xué)多媒體成像組) 無特征對象跟蹤?- 此數(shù)據(jù)集包含幾個具有有限紋理的視頻序列,用于視覺跟蹤,包括手動注釋的每幀姿勢(Lebeda,Hadfield,Matas,Bowden) FlickrLogos-32?- 8240圖像的32個產(chǎn)品標(biāo)識(Stefan Romberg) 一般100數(shù)據(jù)集?- General-100數(shù)據(jù)集包含100個bmp格式的圖像(無壓縮),非常適合超分辨率訓(xùn)練(Dong,Chao和Loy,Chen Change和Tang,Xiaoou) Geometry2view?- 此數(shù)據(jù)集包含用于2視圖幾何計(jì)算的圖像對,包括手動注釋點(diǎn)坐標(biāo)(Lebeda,Matas,Chum) 漢諾威區(qū)域檢測器評估數(shù)據(jù)集?- 從1.5到800萬像素(Kai Cordes)的多個圖像分辨率中的特征檢測器評估序列 Hillclimb和CubicGlobe數(shù)據(jù)集?- 一個集會汽車的視頻,分為幾個獨(dú)立的鏡頭(用于視覺跟蹤和建模)。(Lebeda,Hadfield,Bowden) I3 - Yahoo Flickr Creative Commons 100M?- 此數(shù)據(jù)集包含照片和視頻列表。(B.Thomee,DAShamma,G.Friedland等人) IISc - 孤立對象之間的相似性(IISc-DIO)?- 數(shù)據(jù)集在269個人類受試者上使用具有多樣化對象的視覺搜索任務(wù)進(jìn)行的26,675次感知異常測量(RT Pramod&SP Arun,IISc) INRIA特征檢測器評估序列(Krystian Mikolajczyk) INRIA的PERCEPTION數(shù)據(jù)庫中的圖像和視頻采集了幾臺同步和校準(zhǔn)的相機(jī)(INRIA Rhone-Alpes) 圖像/視頻質(zhì)量評估數(shù)據(jù)庫摘要(Stefan Winkler) 用于立體聲,光學(xué)流和視覺測距的KITTI數(shù)據(jù)集(Geiger,Lenz,Urtasun) LFW-10數(shù)據(jù)集,用于學(xué)習(xí)相對屬性?- 具有10個屬性的實(shí)例級注釋的10,000對面部圖像的數(shù)據(jù)集(CVIT,IIIT Hyderabad。) 來自地面LiDAR掃描的大規(guī)模3D點(diǎn)云數(shù)據(jù)(Andreas Nuechter) 光場材料數(shù)據(jù)集?- 使用Lytro ILLUM攝像機(jī)拍攝的12種物質(zhì)類別的1.2k注釋圖像(王廷俊,朱俊仁,Ebi Hiroaki,Manmohan Chandraker,Alexei Efros,Ravi Ramamoorthi) Linkoping滾動快門整流數(shù)據(jù)集(Per-Erik Forssen和Erik Ringaby) LIRIS-ACCEDE數(shù)據(jù)集?- 具有沿著情感維度(Technicolor)注釋的大內(nèi)容多樣性的視頻摘錄集合 MARIS波托菲諾數(shù)據(jù)集?- 水下立體圖像的數(shù)據(jù)集,描繪圓柱形管道物體并收集以測試物體檢測和姿態(tài)估計(jì)算法。(帕爾馬大學(xué)RIMLab(機(jī)器人與智能機(jī)器實(shí)驗(yàn)室)) MPI Sintel流量數(shù)據(jù)集來自開源3D動畫短片Sintel的光流評估數(shù)據(jù)集。它已被擴(kuò)展為立體聲和差距,深度和相機(jī)運(yùn)動,以及細(xì)分。(馬克斯·普朗克·圖賓根) MPI-Sintel光流評估數(shù)據(jù)集(Michael Black) MSR-VTT?- 視頻到200K +視頻剪輯/句子對的文本數(shù)據(jù)庫 米德爾伯勒大學(xué)立體視覺研究數(shù)據(jù)集(丹尼爾·沙爾斯坦和理查德·西策斯基) 2D橢圓形圖案的建模?- 他的數(shù)據(jù)集包含標(biāo)準(zhǔn)和家庭數(shù)據(jù)集中的4,526個2D形狀(Costas Panagiotakis和Antonis Argyros) Multi-FoV?- 逼真逼真的視頻序列,可以將相機(jī)的視場(FoV)對各種視覺任務(wù)的影響進(jìn)行基準(zhǔn)測試。(Zhang,Rebecq,Forster,Scaramuzza) 多視覺立體聲評估?- 每個數(shù)據(jù)集通過激光掃描過程獲得的“地面真相”3D模型進(jìn)行注冊(Steve Seitz等) 具有激光基礎(chǔ)的多視點(diǎn)立體圖像(ESAT-PSI / VISICS,FGAN-FOM,EPFL / IC / ISIM / CVLab) NCI癌癥圖像存檔?- 前列腺圖像(國家癌癥研究所) NIST 3D興趣點(diǎn)檢測(Helin Dutagaci,Afzal Godil) NRCS自然資源/農(nóng)業(yè)形象數(shù)據(jù)庫(USDA自然資源保護(hù)局) 對象去除?- 使用合成光流的密集立體視覺場景映射的廣義動態(tài)對象去除 - 評估數(shù)據(jù)集(Hamilton,OK,Breckon,Toby P.) 閉塞檢測測試數(shù)據(jù)(Andrew Stein) OSIE - 對象和語義圖像和眼睛跟蹤?- 700圖像,5551分割對象,眼睛跟蹤數(shù)據(jù)(徐,江,王,Kankanhalli,趙) OTIS:打開湍流圖像集?- 通過湍流氣氛進(jìn)行長距離成像的幾個序列(靜態(tài)或動態(tài))(Jerome Gilles,Nicholas B. Ferrante) PHOS(照明不變數(shù)據(jù)集)?- 在不同照明條件下拍攝的15個場景* 15張圖像(Vassilios Vonikakis) PRINTART:著名繪畫作品的藝術(shù)形象,包括細(xì)節(jié)注釋。ECCV發(fā)布了使用此數(shù)據(jù)庫進(jìn)行自動注釋和檢索任務(wù)的基準(zhǔn)。(Nuno Miguel Pinho da Silva) Pics’n’Trails - 連續(xù)存檔的GPS和數(shù)碼照片的數(shù)據(jù)集(Gamhewage Chaminda de Silva) RAWSEEDS SLAM基準(zhǔn)數(shù)據(jù)集(Rawseeds Project) ROMA(ROAD MArkings):用于道路標(biāo)記提取算法評估的圖像數(shù)據(jù)庫(Jean-Philippe Tarel,et al) 機(jī)器人3D掃描存儲庫?- 來自機(jī)器人實(shí)驗(yàn)的3D點(diǎn)云(Osnabruck和Jacobs大學(xué)) 滾動快門整流數(shù)據(jù)集?- 從手持裝置整理卷簾快門視頻(Per-Erik等) SALICON?- 上下文眼睛跟蹤數(shù)據(jù)集中的顯著性c。80個圖像類中有1000個具有眼睛跟蹤數(shù)據(jù)的圖像(Jiang,Huang,Duan,Zhao) SIDIRE:用于照明穩(wěn)健性評估的合成圖像數(shù)據(jù)集 - SIDIRE是一個免費(fèi)提供的圖像數(shù)據(jù)集,提供綜合生成的圖像,可以調(diào)查照明變化對物體外觀的影響(Sebastian Zambanini) Scripps浮游生物相機(jī)系統(tǒng)?- 數(shù)千張圖像。50類浮游生物和其他小型海洋物體(Jaffe等人) 石溪大學(xué)實(shí)境雜波數(shù)據(jù)集(SBU-RwC90)?- 人類排名不同等級的圖像(陳平平,Dimitris Samaras,Gregory Zelinsky) 解卷積網(wǎng)絡(luò)的街景變化檢測?- 具有結(jié)構(gòu),照明,天氣和季節(jié)變化的街景圖像對齊圖像對的數(shù)據(jù)庫(Pablo F. Alcantarilla,Simon Stent,德國Ros,Roberto Arroyo和Riccardo Gherardi) 悉尼房屋?- 具有準(zhǔn)確3D房屋形狀,門面對象標(biāo)簽,密點(diǎn)對應(yīng)和注釋工具箱的街景房屋圖像(Hang Chu,Shenlong Wang,Raquel Urtasun,Sanja Fidler) Technicolor有趣的數(shù)據(jù)集?- 電影摘錄和關(guān)鍵幀的集合,以及基于分類成有趣和非有趣的樣本(Technicolor)的相應(yīng)的地面實(shí)況文件。 Technicolor Hannah數(shù)據(jù)集?- 從“Hannah和她的姐妹”電影153,525幀,為幾種類型的音頻和視覺信息(Technicolor)注釋, Technicolor HR-EEG4EMO數(shù)據(jù)集?- 在觀看中性和情感視頻(Technicolor)期間收集的40個受試者的腦電圖和其他生理記錄 Technicolor VSD暴力場景數(shù)據(jù)集?- 基于提取電影中暴力事件的地面實(shí)況文件的集合(Technicolor) TGIF?- 來自Tumblr和120K自然語言描述的動畫GIF(Li,Song,Cao,Tetreault,Goldberg,Jaimes,Luo) TMAGIC數(shù)據(jù)集?- 視覺跟蹤的幾個視頻序列,包含強(qiáng)大的飛機(jī)外旋轉(zhuǎn)(Lebeda,Hadfield,Bowden) TUM RGB-D基準(zhǔn)?- 用于評估RGB-D視覺測距和SLAM算法的數(shù)據(jù)集和基準(zhǔn)(BCrgen Sturm,Nikolas Engelhard,Felix Endres,Wolfram Burgard和Daniel Cremers) 沖突升級決議(CONFER)數(shù)據(jù)庫?- 來自電視政治辯論的自然主義互動的120個視聽劇集(?142分鐘),在實(shí)際沖突強(qiáng)度方面逐幀加注。(Christos Georgakis,Yannis Panagakis,Stefanos Zafeiriou,Maja Pantic) 開放視頻項(xiàng)目(Gary Marchionini,Barbara M. Wildemuth,Gary Geisler,Yaxiao Song) 圖盧茲消失點(diǎn)數(shù)據(jù)集?- 用于消失點(diǎn)估計(jì)的曼哈頓場景數(shù)據(jù)集,還為每個圖像提供了相機(jī)方向的IMU數(shù)據(jù)(Vincent Angladon和Simone Gasparini) UCL地面真相光流數(shù)據(jù)集(Oisin Mac Aodha) 熱那亞大學(xué)差異和光流評估數(shù)據(jù)集(Manuela Chessa) 神經(jīng)網(wǎng)絡(luò)系統(tǒng)的驗(yàn)證與驗(yàn)證(Francesco Vivarelli) 非常長的基線干涉圖像重建數(shù)據(jù)集(MIT CSAIL) 虛擬KITTI?- 從五個不同的虛擬世界生成的?40個高分辨率視頻(17,008幀),用于:對象檢測和多對象跟蹤,場景級和實(shí)例級語義分割,光流和深度估計(jì)(Gaidon,Wang, Cabon,Vig) 視覺對象跟蹤挑戰(zhàn)?- 這個挑戰(zhàn)每年作為ICCV / ECCV研討會舉行,每年都有一個新的數(shù)據(jù)集和更新的評估套件(Kristan等人) 世界衛(wèi)生組織 - 浮游生物?- 350萬個顯微鏡海洋浮游生物的圖像(奧爾森,索西克) WILD:天氣和虛擬數(shù)據(jù)庫(S. Narasimhan,C. Wang。S. Nayar,D. Stolyarov,K. Garg,Y. Schechner,H. Peri) YACCLAB數(shù)據(jù)集?- YACCLAB數(shù)據(jù)集包括合成和實(shí)際二進(jìn)制圖像(Grana,Costantino; Bolelli,Federico; Baraldi,Lorenzo; Vezzani,Roberto) YtLongTrack?- 此數(shù)據(jù)集包含兩個視頻序列,具有質(zhì)量低,極限長度和完全遮擋等挑戰(zhàn),包括手動注釋的每幀姿勢(Lebeda,Hadfield,Matas,Bowden) 致謝:非常感謝所有貢獻(xiàn)者對數(shù)據(jù)庫的建議。
原文鏈接:http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm
總結(jié)
以上是生活随笔 為你收集整理的常用的图像数据集 的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔 網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔 推薦給好友。