Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略
Dataset之WebVision:WebVision數據集簡介、下載、使用方法之詳細攻略
?
?
?
目錄
WebVision數據集簡介
1、WebVision數據集挑戰
WebVision數據集下載
WebVision數據集使用方法
?
?
?
?
WebVision數據集簡介
? ? ? ? WebVision數據集主要有Google和Flickr兩個數據源。主要是利用ImageNet1000個類的文本信息 從網站上爬數據,所以它的數據類別與}mageNet完全一樣,為1000類別,由240萬幅圖片構成訓練 數據。比}mageNet的兩倍還多,分別由5萬張圖片構成驗證集和測試集(均帶有人工標注)。?
1、WebVision數據集挑戰
(1)、數據分布不平衡
? ? ? WebVision數據集主要有兩個挑戰。 第一個挑戰,數據分布非常不平衡。 如圖橫坐標代表1000個類別,縱坐標代表每個類別的圖片數量。如圖淺藍色的平穩曲線是ImageNet的 數據分布,每一個類別大概有1200張圖片。而深藍色曲線為Web Vision數據分布,可以看出有的類別高達11000張,而最少的小于400張圖片,這種極度不平衡的分布對訓練模型影響非常大。?
(2)、數據集含有大量錯誤或歧義的標簽
? ? ? ? ? 第二個挑戰,數據集含有大量錯誤或歧義的標簽。 數據集中含有大量與類別標簽不相關或歧義的圖片,也就是所謂的噪聲,這也是最主要的一個難點。比如Willet可以是一種鳥,但也可以是人名,也可以是建筑物的名字。
?
WebVision數據集下載
后期更新……
?
?
?
WebVision數據集使用方法
后期更新……
?
?
總結
以上是生活随笔為你收集整理的Dataset之WebVision:WebVision数据集简介、下载、使用方法之详细攻略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Dataset之Fashion-MNIS
- 下一篇: DL之BN-Inception:BN-I