2021-03-12 16个车辆信息检测数据集收集汇总
16個車輛信息檢測數據集收集匯總
1. UA-DETRAC
http://detrac-db.rit.albany.edu/
UA-DETRAC是一個具有挑戰性的現實世界多目標檢測和多目標跟蹤基準。數據集由 Cannon EOS 550D攝像頭在中國北京和天津24個不同地點拍攝的10個小時的視頻組成。視頻以每秒25幀的速度錄制,分辨率為960540像素。在UA-DETRAC數據集中,有超過14萬幀和8250輛車被人工標注,總共標記了121萬物體的邊界盒。我們還對目標檢測和多目標跟蹤方面的最新方法進行基準測試,以及本網站中詳細介紹的評估指標。
車輛分為四類,即轎車、公共汽車、廂式貨車和其他車輛。
天氣情況分為四類,即多云、夜間、晴天和雨天。
標注的車輛的尺度定義為其像素面積的平方根。將車輛分為三種規模:小型(0-50像素)、中型(50-150像素)和大型(大于150像素)。遮擋比我們使用車輛包圍框被遮擋的比例來定義遮擋的程度。
?
遮擋程度分為三類: 無遮擋、部分遮擋和重遮擋。具體來說,定義了部分遮擋(如果車輛遮擋率在1%-50%之間)和重遮擋(如果遮擋率大于50%)。
?
截尾率表示車輛部件在幀外的程度,用于訓練樣本的選擇。
?
?
效果圖:
?
2. BDD100K 自動駕駛數據集
https://bdd-data.berkeley.edu/
?
視頻數據:超過1,100小時的100000個高清視頻序列在一天中許多不同的時間,天氣條件,和駕駛場景駕駛經驗。視頻序列還包括GPS位置、IMU數據和時間戳。
?
道路目標檢測:2D邊框框注釋了100,000張圖片,用于公交、交通燈、交通標志、人、自行車、卡車、摩托車、小汽車、火車和騎手。
?
實例分割:超過10,000張具有像素級和豐富實例級注釋的不同圖像。
?
引擎區域:從10萬張圖片中學習復雜的可駕駛決策。
?
車道標記:10萬張圖片上多類型的車道標注,用于引導駕駛。
?
如圖:
?
3. 綜合汽車(CompCars)數據集
http://mmlab.ie.cuhk.edu.hk/datasets/comp_cars/index.html
?
該數據集在 CVPR 2015論文中給出,Linjie Yang, Ping Luo, Chen Change Loy, Xiaoou Tang. A Large-Scale Car Dataset for Fine-Grained Categorization and Verification, In Computer Vision and Pattern Recognition (CVPR), 2015. PDF。
?
綜合汽車(CompCars)數據集包含來自兩種場景的數據,包括來自web-nature和監視-nature的圖像。
?
web-nature數據包含163輛汽車和1,716個汽車模型??偣灿?36,726張圖像捕捉整個汽車,27,618張圖像捕捉汽車部件。完整的汽車圖像被標記為邊界框和視點。每個車型都有五個屬性,包括最大速度、排水量、車門數量、座椅數量和車型。
?
監視-自然數據包含了5萬張前視圖捕捉到的汽車圖像。
?
該數據集已經為以下計算機視覺任務做好了準備:細粒度分類、屬性預測、汽車模型驗證。
?
本文中介紹的這些任務的訓練/測試子集都包含在數據集中。研究人員也歡迎使用它來完成其他任務,如圖像排序、多任務學習和3D重建。
?
4. Stanford Cars Dataset
http://ai.stanford.edu/~jkrause/cars/car_dataset.html
?
Cars數據集包含196類汽車的16,185張圖像。將數據分成8144張訓練圖像和8041張測試圖像,大致對每個類進行50-50的分割。級別通常按制造、型號、年份劃分,例如2012年特斯拉Model S或2012年寶馬M3 coupe。
?
?
5. OpenData V11.0-車輛重識別數據集 VRID
http://www.openits.cn/opendata4/748.jhtml
?
數據集說明:
?
開放的車輛重識別的數據來自某城市卡口車輛圖像,由326個高清攝像頭拍攝,時間覆蓋日間14天,分辨率從400×424到990×1134不等。數據集中包含最常見的10種車輛款式,共10000張圖像,如表1所列。為了模擬同款車輛對車輛重識別的影響,每個車輛款式里各有100個不同的車輛ID,即100個不同的車輛。在同一車輛款式里的100個車輛ID,它們的外觀近乎相同,差異大部分只在于車窗部分的個性化標識,如年檢標志等。此外,每個車輛ID包含有10張圖像,這10張圖像拍攝于不同的道路卡口,光照、尺度以及姿態均不盡相同,相應的同一車輛也可能會具有不同的外觀。
?
車輛重識別數據集的車輛字段屬性如表2所示,其中車輛品牌表示車輛品牌信息,車牌號碼用于數據庫里同一車輛的關聯,車窗位置代表圖像里的車窗所在區域的坐標,車身顏色表示的是圖像里的車輛顏色信息。這些信息使得數據庫不僅能用于車輛重識別研究,也可用于車輛品牌精細識別,車輛顏色識別等研究。
?
數據集里10種車輛款式,車輛ID數量為100,圖像數據1000張
?
?
數據庫屬性示意表
?
6. N-CARS數據集
https://www.prophesee.ai/dataset-n-cars/
?
N-CARS數據集是一個用于汽車分類的大型基于事件的真實世界數據集。
?
它由12,336個汽車樣本和11,693個非汽車樣本(背景)組成。這些數據是通過安裝在一輛汽車擋風玻璃后的ATIS攝像機記錄下來的。這些數據是從不同的駕駛過程中提取的。數據集被分割為7940個car和7482個背景訓練樣本,4396個 car 和4211個背景測試樣本。每個示例持續100毫秒。
?
7. MIT DriveSeg Dataset
https://agelab.mit.edu/driveseg
?
到目前為止,提供給研究社區的自動駕駛數據主要由靜態的、單一的圖像組成,這些圖像可以通過使用邊界框來識別和跟蹤道路內和周圍的常見物體,比如自行車、行人或交通燈。相比之下,DriveSeg包含了更精確的、像素級的這些常見道路物體的表示,但通過連續視頻駕駛場景的鏡頭。這種類型的全場景分割可以特別有助于識別更多的無定形物體,如道路建設和植被,它們并不總是有這樣明確和統一的形狀。數據集由兩部分組成:
?
DriveSeg(手動)
一種面向前幀逐幀像素級語義標記數據集,該數據集是從一輛在連續日光下通過擁擠的城市街道行駛的移動車輛中捕獲的。
技術摘要
視頻數據:2分47秒(5000幀)1080P (1920x1080) 30幀/秒
?
類定義(12):車輛、行人、道路、人行道、自行車、摩托車、建筑、地形(水平植被)、植被(垂直植被)、桿子、交通燈和交通標志
?
8.? KITTI
· 數據集鏈接:http://www.cvlibs.net/datasets/kitti/
· 論文鏈接:
http://www.webmail.cvlibs.net/publications/Geiger2012CVPR.pdf
?
精確的地面真相由Velodyne激光掃描儀和GPS定位系統提供。我們的數據集是通過在中型城市卡爾斯魯厄(Karlsruhe)、鄉村地區和高速公路上行駛來獲取的。每張圖像可看到多達15輛汽車和30個行人。除了以原始格式提供所有數據外,我們還為每個任務提取基準。對于我們的每一個基準,我們也提供了一個評估指標和這個評估網站。初步實驗表明,在現有基準中排名靠前的方法,如Middlebury方法,在脫離實驗室進入現實世界后,表現低于平均水平。我們的目標是減少這種偏見,并通過向社會提供具有新困難的現實基準來補充現有基準。
?
?
9. CityScapes
· 數據集鏈接:https://www.cityscapes-dataset.com/
?
· 論文鏈接:https://arxiv.org/pdf/1604.01685.pdf
?
提供了一個新的大規模數據集,其中包含了50個不同城市的街道場景中記錄的不同的立體視頻序列,有5000幀的高質量像素級注釋,還有更大的一組2萬幀的弱注釋。因此,該數據集比以前類似的嘗試要大一個數量級。有關注釋類的詳細資料及注釋示例可在此網頁查閱。Cityscapes數據集旨在評估用于語義城市場景理解的主要任務的視覺算法的性能:像素級、實例級和全光學語義標記;支持旨在開發大量(弱)注釋數據的研究,例如用于訓練深度神經網絡。
?
10. Comma.ai 's Driving Dataset
· 數據集鏈接:https://github.com/commaai/research
?
· 論文鏈接:https://arxiv.org/pdf/1608.01230.pdf
?
目的是低成本的自動駕駛方案,目前是通過手機改裝來做自動駕駛,開源的數據包含7小時15分鐘分為11段的公路行駛的行車記錄儀視頻數據,每幀像素為160x320。主要應用方向:圖像識別;
?
11. Udacity 's Driving Dataset
· 數據集鏈接:https://github.com/udacity/self-driving-car/tree/master/datasets
?
· 論文鏈接:未找到
?
Udacity的自動駕駛數據集,使用Point Grey研究型攝像機拍攝的1920x1200分辨率的圖片,采集到的數據分為兩個數據集:第一個包括在白天情況下在加利福尼亞州山景城和鄰近城市采集的數據,數據集包含9,423幀中超過65,000個標注對象,標注方式結合了機器和人工。標簽為:汽車、卡車、行人;第二個數據集與前者大體上相似,除了增加交通信號燈的標注內容,數據集數量上也增加到15,000幀,標注方式完全采用人工。數據集內容除了有車輛拍攝的圖像,還包含車輛本身的屬性和參數信息,例如經緯度、制動器、油門、轉向度、轉速。主要應用方向:目標檢測,自動駕駛;
?
12. D2-City
· 數據集鏈接:https://outreach.didichuxing.com/d2city/
?
背景
D2-City 是一個大規模行車視頻數據集,提供了超過一萬段行車記錄儀記錄的前視視頻數據。所有視頻均以高清(720P)或超高清(1080P)分辨率錄制。我們為其中的約一千段視頻提供了包括目標框位置、目標類別和追蹤ID信息的逐幀標注,涵蓋了共12類行車和道路相關的目標類別。我們為一部分其余的視頻提供了關鍵幀的框標注。
?
和現有類似數據集相比,D2-City 的數據采集自中國多個城市,涵蓋了不同的天氣、道路、交通狀況,尤其是極復雜和多樣性的交通場景。我們希望通過該數據集能夠鼓勵和幫助自動駕駛相關領域研究取得新進展。
?
數據集介紹
D2-City 數據集采集自運行在中國五個城市的滴滴運營車輛。所提供的原始數據均存儲為幀率25fps、時長30秒的短視頻。后續我們將會提供對該數據集的訓練、驗證和測試集的劃分與統計。
?
我們為其中約一千段視頻提供了12類目標的邊界框和追蹤ID標注信息,對其他的視頻,我們提供關鍵幀的框標注。類別信息詳見下表。
?
?
評估任務
基于本數據集,我們將提供一項評估任務(和BDD合作)作為NeurIPS 2019 ML4AD挑戰賽的賽事。任務和評估的詳情請參見競賽網站相關頁面。
?
賽事:D2-City & BDD100K 目標檢測遷移學習挑戰賽 在目標檢測遷移學習挑戰賽中,參賽者需要利用采集自美國的BDD100K數據,訓練目標檢測模型用于采集自中國的D2-City數據。數據集中可能包含稀有或有挑戰性的狀況下采集的數據,如光線不足、雨霧天氣、道路擁堵等,參賽者需要提供在各狀況下準確的目標檢測結果。
?
13. ApolloScape
· 數據集鏈接:http://apolloscape.auto/inpainting.html
?
關于ApolloScape數據集
軌跡數據集,三維感知激光雷達目標檢測和跟蹤數據集,包括約100K圖像幀,80k激光雷達點云和1000km城市交通軌跡。數據集由不同的條件和交通密度,其中包括許多具有挑戰性的場景,車輛,自行車,和行人之間移動。
?
數據集包括以下幾個方面的研究:
Scene Parsing
?
3D Car Instance
?
Lane Segmentation
?
Self Localization
?
Trajectory
?
Stereo
?
Inpainting
?
14. nuScenes
· 數據集鏈接:https://www.nuscenes.org/
?
nuScenes數據集是一個具有3d對象標注的大規模自主駕駛數據集。它特點:
-
完整的傳感器套件(1 x激光雷達、5 x雷達、6 x相機,IMU, GPS)
-
1000 scenes of 20s each
-
1400000相機圖像
-
390000激光雷達掃描
-
兩個不同的城市:波士頓和新加坡
-
左派和右手交通詳細的地圖信息
-
1.4M 3D 邊界盒手工注釋等,23個對象類
-
屬性可見性、活動和姿勢
?
新: 1.1B 激光雷達點手工注釋為32類
新: 探索nuScenes在SiaSearch免費使用非商業用途
?
15. 牛津Robotcar數據集
https://robotcar-dataset.robots.ox.ac.uk/
?
牛津機器人車數據集包含了超過100次在英國牛津的同一路線的重復,采集時間超過一年。數據集捕捉了天氣、交通和行人的許多不同組合,以及建筑和道路工程等長期變化。
?
16. Vehicle Image Database
http://www.gti.ssr.upm.es/data/Vehicle_database.html?spm=5176.100239.0.0.XGJd1k
?
圖像處理組目前正在研究基于視覺的車輛分類任務。為了評估我們的方法,我們創建了一個新的圖像數據庫,這些圖像是從我們的視頻序列中提取的(通過安裝在車輛上的向前看的攝像機獲取)。該數據庫包括3425張從不同角度拍攝的車輛尾部圖像,以及3900張從不包含車輛的道路序列中提取的圖像。選擇圖像是為了最大化vehicle類的代表性,這涉及到自然的高可變性。在我們看來,影響車輛后部外觀的一個重要特征是車輛相對于攝像機的位置。因此,數據庫根據姿態將圖像劃分為四個不同的區域:鏡頭前的中/近距離,左側的中/近距離,右側的近/中距離,以及遠距離。此外,為了使分類器在假設生成階段對偏移量具有更強的魯棒性,我們提取的圖像不能很好地貼合車輛的輪廓。相反,一些圖像松散地包含了車輛(一些背景也包含在圖像中),而其他圖像只包含部分車輛。對同一運載工具的多個實例分別給出了不同的邊界假設。這些圖像的分辨率為64x64,是從馬德里、布魯塞爾和都靈的高速公路上記錄的360x256像素序列中裁剪出來的。
?
附:交通標志數據集
1)KUL Belgium Traffic Sign Dataset,比利時的一個交通標志數據集。
2)German Traffic Sign,德國交通標注數據集。
3)STSD,超過20 000張帶有20%標簽的圖像,包含3488個交通標志。
4)LISA,超過6610幀上的7855條標注。
5)Tsinghua-Tencent 100K ,騰訊和清華合作的數據集,100000張圖片,包含30000個交通標志實例。
總結
以上是生活随笔為你收集整理的2021-03-12 16个车辆信息检测数据集收集汇总的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 关于侧信道攻击
- 下一篇: 002 如何将电子版一寸照以照片的方式打