天池和Kaggle:Notebook使用对比
天池競賽平臺作為阿里云旗下的重要競賽社區,每年都會舉辦上百場數據競賽。數據競賽不僅可以匯集參賽選手,同時也可以沉淀具體的學習內容。
拿Kaggle舉例,其魅力之處就在于Kaggle Notebook有很多豐富的學習資料,可以供學習者學習和使用。
從2019年開始天池逐步推出DSW (Data Science Workshop)運行環境,可供選手可以在云平臺完成編碼和學習。據筆者了解,天池DSW是國內首個支持GPU和CPU的學習環境,非常值得使用的。
本文從在線學習環境的角度(即在線Notebook)將天池與Kaggle進行對比:
Notebook與平臺生態
Notebook使用體驗對比
Notebook與平臺生態
首先我們從Notebook與競賽平臺生態進行分析,在天池和Kaggle中在線Nobteook都是非常重要的一個環節。開源在競賽中隨處可見,從競賽參賽方式、賽題數據集到賽題在線Notebook,都是各種的眾包參與形式,且內容都可以多人一起貢獻。
在上述元素中,Notebook是特別重要的一個環節。
天池Notebook(DSW):https://tianchi.aliyun.com/notebook-ai/
Kaggle Notebook:https://www.kaggle.com/notebooks
Notebook作為在線運行環境:
提供一個配置好環境的運行的環境,所有參賽選手免去在本地配置環境的環節;
可以作為代碼和思路的分享,比如比賽分析過程和解決方案的展示;
可以作為比賽比賽提交的入口,如比賽最終提交可以從Notebook提交;
可以提供系列的學習資源和實踐教材,可以作為在線教材;
Notebook作為在線展示方式:
具備有版本存儲的功能,可以存儲歷史運行的代碼;
具備有渲染Markdown、圖片和公式的功能,展示方式更加靈活;
具備有與數據集和比賽交互的過程;
Notebook使用體驗
Kaggle Notebook界面https://www.kaggle.com/code
天池DSW界面https://dsw-dev.data.aliyun.com/
Notebook對比
| 界面 | Juypter Lab | 自定義網頁 |
| 使用時間 | 總共使用時間不限制 CPU和GPU單次鏈接8小時 每次鏈接可以運行多個Notebook | CPU時間不限,GPU每周35小時 可以同時運行多個CPU Notebook 只能運行一個GPU Notebook |
| 文件目錄 | 工作目錄與文件目錄混合 | 工作目錄與數據文件分開 |
| 文件系統 | 多個Notebook共享 | 單個Notebook獨占 |
| Markdown目錄 | 支持 | 不支持 |
| 數據集 | 支持掛載數據集 | 支持掛載數據集 |
| 內存 | 4G,多個Notebook共享 | 16G,單個Notebook獨占 |
| 顯存 | 16G,多個Notebook共享 | 11G,單個一個Notebook獨占 |
| 聯網 | CPU模型可以聯網 GPU模型不可以聯網 | CPU和GPU都可以聯網 |
| 穩定性 | CPU較為穩定 GPU穩定性一般 | 較為穩定 |
| Shell | 支持 | 不支持 |
| 上傳文件 | 支持 | 不支持,可在Dataset頁面上傳 |
| 發布 | 支持發布到天池論壇 | 支持發布到Kaggle論壇 |
| 版本 | 支持版本管理,但不完善 | 支持版本管理,比較完善 |
| Copy & Fork | 支持 | 支持 |
| 評論 | 支持 | 支持 |
從上表對比可知,天池DSW與Kaggle Notebook環境雖然整體都為在線Notebook,但在使用上存在一定的差異性:
資源分配:天池DSW環境可以同時運行多個Notebook,且多個Notebook資源共享;Kaggle Notebook每個資源獨立,且文件各自不共享;
使用方式:天池DSW環境與Juypter Lab比較類似,而Kaggle Notebook是固定好輸入情況下的代碼運行環境;
從使用角度天池DSW比較靈活強大,而Kaggle Notebook每個功能比較單一。所以如果大家在國內,建議使用天池DSW。
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯 本站qq群851320808,加入微信群請掃碼:總結
以上是生活随笔為你收集整理的天池和Kaggle:Notebook使用对比的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微软:Win11很受欢迎、正式版将于秋季
- 下一篇: Win11更新22000.71:优化任务