【数据集下载神器】体验1000+优质数据集极速下载
在一個合格模型的誕生過程中,繁雜的數據收集與處理工作往往給算法工程師帶來了低效的工作體驗。
▲一個模型的誕...生...
好的數據,對模型訓練至關重要。自己做數據,即昂貴又費時費力;但是,使用現成的數據集,既不好找又不好下載及使用,數據質量也參差不齊,只有到下載后才能知道!
……
等等!
小編最近發現了一個數據集獲取神器
Graviti Open Dataset
這是一個提供公開數據集的平臺,你可以很方便地從中搜索到想要的數據集,可在線預覽樣例數據、標注、標簽,無需“梯子”即可免費高速下載國外數據集。
??豐富多元的數據集種類
目前,Graviti Open Dataset已收錄1000+個高質量人工智能數據集。提供一站式檢索、高速下載,免費貢獻學術社區。
覆蓋2D/3D目標檢測、圖像分割、圖像分類、目標跟蹤、OCR、姿態估計、無人駕駛、智慧零售、機器人等多種AI應用領域。
與此同時,Graviti Open Dataset還包含了點云、圖像、視頻序列、三維模型等多種數據格式。
這里舉兩個栗子:
無人駕駛類數據集
KITTI-object&Synscapes
▲KITTI-object,含2D/3D目標檢測點云和圖像數據
▲Synscapes,含25,000個真實街景圖像
文本識別類數據集
MNIST&SVHN
▲MNIST,含60,000個手寫數字樣本的訓練集和10,000個樣本的測試集
▲SVHN,含600,000個數字圖像
??便捷迅速的數據集查找
想找心儀數據集,現在一目了然。你不僅可以靠數據集的內容關鍵詞搜索,還可以通過應用行業、標注類型等屬性進行多維度查詢。
眾所周知:找數據難,找海外數據更是難上加難。但擁有Graviti網站就像擁有一把萬能鑰匙。
想進行COVID肺部醫學影像檢測模型訓練?
在搜索框輸入“COVID”即可一鍵抵達
▲搜索得到的優質數據集示例
還想搜索醫學影像數據集?
選擇“medical”進行行業搜索即得
▲更多醫學相關數據集
? 直接美觀的數據集可視化
話不多說,先上圖片
▲訓練集人像截取示例
▲圖像多元素分類
使用Graviti數據可視化插件,實現在線可視化數據標注和數據分布,所見即為所得。
更有多種可視化方案供你隨時查看。再也不用擔心費勁下完整套數據才發現根本不是自己想要的內容。
還 沒 有?心 動?嗎 ?
壓軸亮點來了!
??暢通高速的海外數據下載
很多時候,我們的數據獲取渠道都只提供主流的國內公開數據集,而更普適的模型卻需要用海內外的多元數據去共同訓練。
針對海外數據獲取難、下載慢的問題,Graviti給出了一站式解決方案——將全球資源Host至國內鏡像,無需VPN訪問,滿帶寬極速下載。和進入海外官網下載相比,Graviti至少提速100%。
從此告別繁瑣的登錄注冊流程,告別令人抓狂的下載時長!
▲普通帶寬下載海外數據,實測就有10MB/s的速度
那么問題來了,海外下載提速需要會員嗎?還是按次計費呢?
答案是:
“
完全免費
”????
在Graviti,還有更多有趣又高質量的數據集在持續更新中,快來一起探索吧!
另外,如果你在他們網站發現自己感興趣的數據不存在,也可以進他們的官方微信群反饋,說不定下次就為你上線了呢:)
一鍵獲取數據集↓
↑進官方微信群
除了托管公開標準的數據集,小編還發現該網站正在開發針對用戶的個性化的數據管理服務,包括數據免費托管、數據版本管理~還可以輕松完成對數據的拆分與合并,對于開發自己數據集的同學無疑是個非常值得期待的功能。
點擊閱讀原文,直達官網體驗。
總結
以上是生活随笔為你收集整理的【数据集下载神器】体验1000+优质数据集极速下载的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 摊牌了,我靠他实现了NLP模型使用入门
- 下一篇: 【深度学习】梯度消失和梯度爆炸问题的最完