【机器学习算法-python实现】决策树-Decision tree(1) 信息熵划分数据集
生活随笔
收集整理的這篇文章主要介紹了
【机器学习算法-python实现】决策树-Decision tree(1) 信息熵划分数据集
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
1.背景
決策書算法是一種逼近離散數(shù)值的分類算法,思路比較簡單,而且準(zhǔn)確率較高。國際權(quán)威的學(xué)術(shù)組織,數(shù)據(jù)挖掘國際會議ICDM (the IEEE International Conference on Data Mining)在2006年12月評選出了數(shù)據(jù)挖掘領(lǐng)域的十大經(jīng)典算法中,C4.5算法排名第一。C4.5算法是機器學(xué)習(xí)算法中的一種分類決策樹算法,其核心算法是ID3算法。
算法的主要思想就是將數(shù)據(jù)集按照特征對目標(biāo)指數(shù)的影響由高到低排列。行成一個二叉樹序列,進(jìn)行分類,如下圖所示。
總結(jié)
以上是生活随笔為你收集整理的【机器学习算法-python实现】决策树-Decision tree(1) 信息熵划分数据集的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【机器学习算法-python实现】决策树
- 下一篇: 【机器学习算法-python实现】逻辑回