ObjectT5:在线随机森林-Multi-Forest-A chameleon in track in
原文::Multi-Forest:A?chameleon?in?tracking,CVPR2014? 下的蛋...原文
使用隨機森林的優勢,在于可以使用GPU把每棵樹分到一個流處理器里運行,容易并行化實現。
OpenCV中的使用:OpenCV:使用 隨機森林與GBDT
隨機森林的優點:http://www.cnblogs.com/wentingtu/archive/2011/12/13/2286212.html
- 在數據集上表現良好
- 在當前的很多數據集上,相對其他算法有著很大的優勢
- 它能夠處理很高維度(feature很多)的數據,并且不用做特征選擇
- 在訓練完后,它能夠給出哪些feature比較重要
- 在創建隨機森林的時候,對generlization error使用的是無偏估計
- 訓練速度快
- 在訓練過程中,能夠檢測到feature間的互相影響
- 容易做成并行化方法
- 實現比較簡單
(1):在線Boost
使用在線Boosting項目主頁:http://www.vision.ee.ethz.ch/boostingTrackers/index.htm
使用在線boosting學習的Code:http://www.vision.ee.ethz.ch/boostingTrackers/download.htm
使用Haar特征樹作為弱分類器,取得不錯的效果。但是速度稍慢。
(2):在線隨機森林:
09年,ICCV 上的文章,效果和離線的random forest差不多,特別的牛。可以做分類,也可以做預測....
程序下載:http://www.everbox.com/f/7igWhZFJBp7xxqmbaM6UyewatN
這里介紹的主要是在線隨機決策樹,其思想主要是:每棵樹可以在線分裂。每個葉子分裂的條件是預測的數量要達到一定的值和每個葉子節點信息。
每個樹的生長主要通過預測的樣本(在線接受的樣本),每棵樹的葉子節點分裂主要根據該節點的熵或Gini
? ? ? ? ? ? ? ? ? ? ? ? ? ?? ?? ? ? ????or?? ??
學過決策樹和信息論的,對這個概念都有了解。其中j表示第j棵樹,i表示第i個分類結果。K表示總的分類數。
對有一個給定的結合S(在線預測中給定),每棵樹上葉子節點Pj的的概率可以表示為:
如果要在Pj葉子節點分類,那么,得到二個葉子節點的概率可以用下式表示:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? ? ? ? ? ? ?and ? ? ? ? ? ??
解釋一下 Pjls,l為left,s為測試集合。所以Pjls表示為在集合S中Pj葉子節點的分列的左節點。同理,Pjrs表示為在集合S中Pj葉子節點的分列的右節點。
那么,每棵樹上葉子節點Pj分裂必須符合以下二個條件:
? ? ? ? 1. 落在葉子節點Pj的個數必須大于一個常數(可以人工設定)
? ? ? ? 2. 葉子節點的Gini必須大于一個常數(可以人工設定),Gini計算公式如下:
??????? 以上步驟就完成整個樹的更新。
步驟3. 用個possion分布確定從采樣的次數,其原理見online boosting:?http://www.cnblogs.com/liqizhou/archive/2012/05/10/2494145.html
步驟6. u代表分類的類別。
步驟7. j代表第t棵樹上葉子節點。
步驟8. 統計第j個葉子節點的數目和計算Gini
步驟9. 判斷條件是否分裂的二個條件。
步驟10. 在符合條件的葉子節點中,選擇一個Gini最大的葉子節點作為分類節點。
以上就是online Random forests 的主要思想
下面給出了在線隨機森林算法的流程:
待寫....
總結
以上是生活随笔為你收集整理的ObjectT5:在线随机森林-Multi-Forest-A chameleon in track in的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 云顶之奕光是什么羁绊 云平台基本概念
- 下一篇: (zxing.net)一维码Code 1