uci数据集_数据分析找不到数据集?快来看这个盘点
前言
數據集相對于機器學習而言是至關重要的,可以說好的數據集是成功的一半。但是,我們很難找到一個特定的數據集來解決各種機器學習問題,甚至是進行實驗。因而找到合適的數據集是一件很難的事情,接下來我們就盤點一下一些優質的數據集資源,或許會幫到你哦。
Kaggle Datasets
每個dataset都是一個小型社區,您可以在其中討論數據、查找一些公共代碼或在內核中創建自己的項目。它們包含大量的實際數據集,這些數據集具有各種形狀、大小和許多不同的格式。您還可以看到與每個數據集關聯的“內核”,其中許多不同的數據科學家提供了筆記本來分析數據集。有時候你可以在自己筆記本上想到一些算法來解決這個特定數據集中的預測問題。
https://www.kaggle.com/datasets
Amazon Datasets
該數據源包含不同領域的許多數據集,如:(公共交通、生態資源、衛星圖像等)。它也有一個搜索框,以幫助您找到您正在尋找的數據集,它也有數據集描述和使用的所有數據集的例子,這是非常有用的,易于使用!
這些數據集存儲在Amazon Web Services (AWS)資源中,比如Amazon S3——云中的一個高度可伸縮的對象存儲服務。如果您正在使用AWS進行機器學習實驗和開發,這將非常方便,因為數據集的傳輸非???#xff0c;因為它是AWS網絡的本地數據集
https://registry.opendata.aws/?source=post_page
UCI ML Repository
加州大學信息與計算機科學學院的另一個巨大的數據庫,包含了100多個數據集。它根據機器學習問題的類型對數據集進行分類。您可以為單變量和多變量時間序列數據集、分類、回歸或推薦系統找到數據集。UCI中的一些數據集已經被清理并準備好使用。
https://archive.ics.uci.edu/ml/index.php
Google數據集搜索引擎
在2018年末,谷歌盡其所能,推出了另一項偉大的服務。它是一個工具箱,可以按名稱搜索數據集。他們的目標是統一成千上萬個不同的數據集存儲庫,使數據集可被發現。干得好,谷歌。
https://toolbox.google.com/datasetsearch?source=post_page
Microsoft Datasets
2018年7月,微軟與外部研究界共同宣布啟動“微軟研究院開放數據”
https://msropendata.com/?source=post_page
Awesome公共數據庫
這是一個按主題組織的數據集的偉大來源,如生物學、經濟學、教育學等。這里列出的大多數數據集都是免費的,但是在使用任何數據集之前,您應該始終檢查許可要求。
https://github.com/awesomedata/awesome-public-datasets?source=post_page
計算機視覺數據集
如果您正在從事圖像處理、計算機視覺或深度學習,那么這應該是您的實驗數據來源。
視覺數據包含少量的大型數據集,可用于構建計算機視覺(CV)模型。您可以通過特定的CV主題來查找特定的數據集,如語義分割、圖像標題、圖像生成,甚至可以通過解決方案(自動駕駛汽車數據集)來查找數據集。
https://www.visualdata.io/?source=post_page
Lionbridge AI Datasets
https://lionbridge.ai/datasets/?source=post_page
總而言之,似乎有一個全球性的方向,就是讓越來越多的數據可用,讓研究和機器學習社區更容易獲得。這些新數據集的社區將繼續增長,使數據更容易訪問,以便眾包和計算機科學社區能夠繼續快速創新,為生活帶來更多創造性的解決方案。
總結
以上是生活随笔為你收集整理的uci数据集_数据分析找不到数据集?快来看这个盘点的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ARM资源免费下载
- 下一篇: tablayout支持改变选中文字大小,