kaggle中的Two-Stage比赛规则以及metadata数据的使用规定
[1]是Two-Stage比賽的一些說明.
分為兩階段,
merge deadline之前是stage1,
mereg deadline之后是stage2.
[1]中的意思是為了防止參賽者不寫代碼直接使用別人的成果,
所以在stage1要求參賽者提供代碼,并且要求改代碼能復現submission.csv中的數據.
如果不提交代碼,就取消最終成績.
---------------------------------------------------提交模型的方法---------------------------------------------------
先選擇Team,如下:
然后選擇:
模型和python或者.ipynb文件都需要打包在一個壓縮包里面,kaggle只保留最新的壓縮包.
?
總結下就是:
Two-Stage比賽的Stage 1需要在kaggle頁面的兩個不同的地方
分別提交模型文件以及submission.csv
--------------------------------------------------------------------------------------------------------------------------------------------------------
[2]中提到,
如果代碼中帶有隨機部分,導致submission.csv的結果是不可復現的,那么提交的結果可能會被拒絕.
原文如下:
?It is possible for you to be rejected from claiming the prize if your code doesn't generate exactly the outcome because of random seed.(但是我覺得這種問題,要死一起死吧,誰不用random seed?)
?
?
[3]中提到,除了提交模型生成的代碼文件,還要上傳權重文件.
?
[4]中官方人士提到:
stage1結束后不準再修改代碼.
stage2用stage1上傳的代碼來預測新的測試集.
?
?
[5]中提到:
metadata can be used for pre-processing of images, but they cannot be features in your model or used to change or label predictions post-modeling.
意思是dicom中的metadata可以用來預處理,但是不能作為模型的特征。
?
[6]中提到:
stage1結束后,stage1的測試集會公布類別標簽,可以根據自己需要重新訓練。
?
個人感覺:
這類比賽其實是因為kaggle感覺自己也無法提供很有力的設備資源而做出的一種折衷.
?
總結下:
Two-stage比賽需要提交三個東西,
1.模型(必須在stage1和stage2分別至少提交一次)
2.代碼
3.submission.csv(必須在stage1和stage2分別至少提交一次)
4.根據[1],似乎是在進行人工檢查。
5.根據[7]如果使用預訓練模型,那么只需要在readme文件中指出即可
?
也就是說,two-stage比賽中需要上傳模型指的是上傳能產生模型的文件以及其他證明資料即可。
?
?
Reference:
?
[1]Two-Stage Frequently Asked Questions
[2]Two stage competition FAQ
[3]Varying .png resolutions
[4]Model submission for stage 1
[5]2 step pipeline: Predict anys then the hemorrhage type
[6]Will stage1 test data's label be released?
[7]summary of Two-stage competitions
總結
以上是生活随笔為你收集整理的kaggle中的Two-Stage比赛规则以及metadata数据的使用规定的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: kaggle的kernel-only比赛
- 下一篇: CT流程与CT图像的windowing操