太强了!Kaggle竞赛宝典方案汇总
kaggle競賽寶典公眾號建立的初衷是希望將很多經典比賽的方案寫成案例的形式,每個步驟都配有一定的闡述,講述某些操作為什么有效等,希望可以幫助更多的新手快速入門(太多的開源只有代碼,看代碼的時間是巨大的,復現的代價也是很大的,而且很多操作也不一定有效)。到目前為止,kaggle競賽寶典已經有9個kaggle的到銀牌的案例,以及10+個國內競賽的案例,此處將這些案例以及對應的鏈接一起匯總在下方,方便大家快速查找學習。
Kaggle平臺
1. Web Traffic Time Series Forecasting比賽(時序問題)
Web_Traffic_Part1賽題分析
Web_traffic_Part2_EDA
Web_traffic_Part3_銀牌NN方案
Web銀牌規則方案
2.?Corporación Favorita Grocery Sales Forecasting(時序問題)
Corporación Favorita_賽題分析
Corp_數據探索分析Part2_單變量數據探索
Corp_數據探索分析Part3_特征變量&標簽關系分析
Corp_數據探索分析Part4_特征變量&特征變量關系分析
Corp_Baseline
Corp_銀牌方案
3.?Santander?Customer?Transaction?Prediction(匿名,二分類)
Santander Customer Transaction Prediction競賽Part1_EDA
Santander Customer Transaction Prediction競賽Part2_LB:0.900
Santander Customer Transaction Prediction競賽Part3_Magic(銀牌)
Santander Customer Transaction Prediction競賽Part4_Top1%
Santander Customer Transaction Prediction競賽Part5_方案匯總
4. Microsoft Malware Prediction(二分類,時序)
Microsoft Malware Prediction比賽EDA_Part1
Microsoft Malware Prediction比賽Part2_LGBBaseline(LB:0.694)
Microsoft Malware Prediction比賽Part3_AvSig強特+LGB(0.701)
5.?Click-Through Rate Prediction(推薦)
Click-Through Rate Prediction:數據探索分析(Part1)
Click-Through Rate Prediction:銀牌(Part2)
6.?Instacart Market Basket Analysis(推薦)
Instacart Market Basket Analysis(Part 1):EDA&Baseline
Instacart Market Basket Analysis(Part 2):0.3787363
Instacart Market Basket Analysis(Part3_1):0.4036596(銅牌)
Instacart Market Basket Analysis(Part3_2):0.4036596(銅牌)
7.?Titanic: Machine Learning from Disaster(二分類,入門)
Titanic: Machine Learning from Disaster
8.?Kaggle Two Sigma(股票預測)
Kaggle Two Simga 第四名方案 Part 1(Shannon提供)
Kaggle Two Simga 第四名方案 Part 2(Shannon提供)
Kaggle Two Simga 第四名方案 Part 3 NN模型(Shannon提供)
9.??IEEE-CIS Fraud Detection(二分類,欺詐)
IEEE-CIS Fraud Detection_Part1_賽題分析
IEEE比賽的一些建議&秋招AI/機器學習/數據挖掘崗位面試注意點
IEEE Part3: 有趣的強特&強tricks
10.??ASHARE(分類,剩余的賽后補充)
ASHARE_Part1: 賽題分析
國內競賽平臺
1.?CMTR(KDD19,推薦,多分類)
ContextAware MultiModal Transportation Recommendation Part1賽題解析
ContextAware MultiModal Transportation Recommendation Part2 EDA
CAMMTR(KDD19)_Part3_多分類Baseline分享(含Code)
CAMMTR(KDD19)_Part4_復賽top10方案(含Code)
2. NIPS2018 AutoML比賽(匿名,多數據集)
2018年NIPS會議AutoML大賽Part1,AutoFeature篇
18NIPSAutoML Part2&3,ModelSelection&Hyperpara Tuning
3. JDATA19_用戶對品類下店鋪的購買預測(時序,推薦)
JDATA19_用戶對品類下店鋪的購買預測_A榜0.058(top20)方案
4.?全球城市計算AI挑戰賽(時序,回歸)
全球城市計算AI挑戰賽Part1_EDA
天池地鐵流量預測Part2_Rule(LB_12.10,Top2%)?(人畜無害小白兔提供)
全球城市計算AI挑戰賽Part3_(A top1, C top2方案)
5.?信貸用戶逾期預測(二分類,欺詐)
“信貸用戶逾期預測”算法大賽優勝獎方案分享
6.?天文數據挖掘大賽(多分類,天文)
天文數據挖掘大賽方案季軍方案
7.??JDD人口動態普查(時序)
JDD人口動態普查與預測,2018(正逆向時序建模)
8.?工程機械設備故障預測(多分類)
基于機器學習的工程機械設備故障預測系統Part1 - EDA 部分
基于機器學習的工程機械設備故障預測系統Part2 -- Top5方案
基于機器學習的工程機械設備故障預測系統Part3 -- 測試集leak
9.??消費者人群畫像—信用智能評分
MSE+MAE提高回歸精度的方法(消費者人群畫像—信用智能評分為例)
消費者人群畫像-信用智能評分Top1?(有夕提供)
??
10.??騰訊廣告算法大賽19
騰訊廣告算法大賽19_Top5方案&代碼(有夕提供)
2019騰訊廣告算法大賽方案分享(冠軍)?????
11.??科大訊飛工程機械核心部件壽命預測挑戰賽(New!)
科大訊飛工程機械核心部件壽命預測挑戰賽冠軍分享?
12.??科大訊飛工程機械核心部件壽命預測挑戰賽(New!)
2019CCF-BDCI-乘用車細分市場銷量預測方案(Top1%)
13.??CCF BDCI新聞情感分類(New!)
CCF BDCI新聞情感分類初賽A榜4/2735,復賽Top1%題解報告
14.??DigSci科學數據挖掘大賽(New!)
DigSci科學數據挖掘大賽:如何在3天內拿下DigSci亞軍
備注:公眾號菜單包含了整理了一本AI小抄,非常適合在通勤路上用學習。
往期精彩回顧那些年做的學術公益-你不是一個人在戰斗適合初學者入門人工智能的路線及資料下載機器學習在線手冊深度學習在線手冊備注:加入本站微信群或者qq群,請回復“加群”加入知識星球(4500+用戶,ID:92416895),請回復“知識星球”喜歡文章,點個在看
總結
以上是生活随笔為你收集整理的太强了!Kaggle竞赛宝典方案汇总的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 概率论基础知识
- 下一篇: 爱可可推荐!关于竞赛思路,方法和代码实践