sklearn分类模型
生活随笔
收集整理的這篇文章主要介紹了
sklearn分类模型
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
分類學習
輸入:一組有標簽的訓練數據(也稱觀察和評估),標簽表明了這些數 據(觀察)的所署類別。
輸出:分類模型根據這些訓練數據,訓練自己的模型參數,學習出一個 適合這組數據的分類器,當有新數據(非訓練數據)需要進行類別判斷,就 可以將這組新數據作為輸入送給學好的分類器進行判斷。
劃分數據集
訓練集(training set):顧名思義用來訓練模型的已標注數據,用來建 立模型,發現規律。
測試集(testing set):也是已標注數據,通常做法是將標注隱藏,輸送 給訓練好的模型,通過結果與真實標注進行對比,評估模型的學習能力。
訓練集/測試集的劃分方法:根據已有標注數據,隨機選出一部分數據 (70%)數據作為訓練數據,余下的作為測試數據,此外還有交叉驗證法, 自助法用來評估分類模型。
評價標準
精確率:精確率是針對我們預測結果而言的,(以二分類為例)它表示 的是預測為正的樣本中有多少是真正的正樣本。那么預測為正就有兩種可能 了,一種就是把正類預測為正類(TP),另一種就是把負類預測為正類(FP), 也就是
召回率:是針對我們原來的樣本而言的,它表示的是樣本中的正例有多 少被預測正確了。那也有兩種可能,一種是把原來的正類預測成正類(TP), 另一種就是把原來的正類預測為負類(FN),也就是
總結
以上是生活随笔為你收集整理的sklearn分类模型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谷歌李飞飞已经确认离职 接替者Andre
- 下一篇: 轮胎爆胎可以保险不