深度学习核心技术精讲100篇(九)-Catboost算法原理解析及代码实现
生活随笔
收集整理的這篇文章主要介紹了
深度学习核心技术精讲100篇(九)-Catboost算法原理解析及代码实现
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前言
今天博主來介紹一個超級簡單并且又極其實用的boosting算法包Catboost,據開發者所說這一boosting算法是超越Lightgbm和XGBoost的又一個神器。
catboost 簡介
在博主看來catboost有一下三個的優點:
- 它自動采用特殊的方式處理類別型特征(categorical features)。首先對categorical features做一些統計,計算某個類別特征(category)出現的頻率,之后加上超參數,生成新的數值型特征(numerical features)。這也是我在這里介紹這個算法最大的motivtion,有了catboost,再也不用手動處理類別型特征了。
- catboost還使用了組合類別特征,可以利用到特征之間的聯系,這極大的豐富了特征維度。
- catboost的基模型采用的是對稱樹,同時計算leaf-value方式和傳統的boosting算法也不一樣,傳統的boosting算法計算的是平均數,而catboost在這方面做了優化采用了其他的算法,這些改進都能防止模型過擬合。
catboost 實戰
這里博主采用的是之前參加一個CTR點擊率預估的數據集,首先通過pandas讀入數據。
from catboost import CatBoostClassifier import pandas as pd from sklearn.model_selection import train_test_split i
總結
以上是生活随笔為你收集整理的深度学习核心技术精讲100篇(九)-Catboost算法原理解析及代码实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习核心技术精讲100篇(七)-ke
- 下一篇: Tableau必知必会之图表显示部分标签