深度学习核心技术精讲100篇(十)-机器学习模型融合之Kaggle如何通过Stacking提升模型性能
生活随笔
收集整理的這篇文章主要介紹了
深度学习核心技术精讲100篇(十)-机器学习模型融合之Kaggle如何通过Stacking提升模型性能
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前言
之前的文章中談到了機器學習項目中,要想使得使得機器學習模型進一步提升,我們必須使用到模型融合的技巧,今天我們就來談談模型融合中比較常見的一種方法——stacking。翻譯成中文叫做模型堆疊,接下來我們就來了解下,此法到底如何將模型做堆疊從而提升模型效果的。
stacking具體流程
我們就對著下圖(兩層的stacking)來詳細描述一下如何做模型stacking:
- 首先將數據分為5份,
- 在stacking的第一層定義5個基模型[model_1 ,model_2,model_3,model_4,model_5],其中每個模型選擇做一下5折的交叉驗證的預測,這樣就相當于每個模型將所有數據預測了一遍,舉個例子,最終每一個訓練數據會被轉換為[1,1,1,1,0]形狀,維度為5的向量。
- 將第一層5個基模型的輸出預測向量[1,1,1,1,0],作為第二層模型model_6的特征做訓練,
- 做test時,直接將test的數據喂給之前第一層訓練好的5個基模型,5個模型預測出的至平均后作為第二層模型的輸入。
大家可以簡單的將stacking的第一層模型理解成一個超強的特征轉換層。
總結
以上是生活随笔為你收集整理的深度学习核心技术精讲100篇(十)-机器学习模型融合之Kaggle如何通过Stacking提升模型性能的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Keras命名体识别(NER)实战---
- 下一篇: Java 动态调试技术原理及实践