spark mllib 朴素贝叶斯 naive bayes
生活随笔
收集整理的這篇文章主要介紹了
spark mllib 朴素贝叶斯 naive bayes
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
為什么80%的碼農都做不了架構師?>>> ??
數據源說明
第一列每行的標簽,其他列為特征
運行代碼如下
package spark.logisticRegressionimport org.apache.spark.mllib.classification.NaiveBayes import org.apache.spark.mllib.linalg.Vectors import org.apache.spark.mllib.util.MLUtils import org.apache.spark.{SparkConf, SparkContext}/*** 分類 - 樸素貝葉斯簡單示例* 后驗概率 = 先驗概率 x 調整因子* Created by eric on 16-7-18.*/ object Bayes {val conf = new SparkConf() //創建環境變量.setMaster("local") //設置本地化處理.setAppName("Bayes") //設定名稱val sc = new SparkContext(conf)def main(args: Array[String]) {val data = MLUtils.loadLabeledPoints(sc, "./src/main/spark/logisticRegression/bayes.txt")val model = NaiveBayes.train(data, 1.0)model.labels.foreach(println)//打印 label(labels是標簽類別)model.pi.foreach(println)//打印先驗概率 (pi存儲各個label先驗概率)//0.0//1.0//2.0//-1.0986122886681098//-1.0986122886681098//-1.0986122886681098val test = Vectors.dense(0, 0, 10)//新預測數據val result = model.predict(test)//預測結果println(result)//2.0} }?
bayes.txt
0,1 0 0 0,2 0 0 1,0 1 0 1,0 2 0 2,0 0 1 2,0 0 2結果如圖
轉載于:https://my.oschina.net/sunmin/blog/720073
總結
以上是生活随笔為你收集整理的spark mllib 朴素贝叶斯 naive bayes的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Linux文件管理以及一些常用的基础命令
- 下一篇: ubuntu14.6 密码重置_已迁移