libsvm2.9数据格式
生活随笔
收集整理的這篇文章主要介紹了
libsvm2.9数据格式
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
所有關(guān)于libsvm2.9的前期工作準(zhǔn)備好以后,就必須考慮將自己的數(shù)據(jù)轉(zhuǎn)換為libsvm對應(yīng)的格式來做分類驗(yàn)證的問題
訓(xùn)練與測試數(shù)據(jù)文件的格式如下所示
<label> <index1>:<value1> <index2>:<value2>…
.
.
.
每行包含一個實(shí)例,并且以字符’/n’結(jié)束。對于分類來講,<label>是整型數(shù)據(jù),表示類別(支持多分類)。對于回歸來講,<label>是任意實(shí)數(shù)(浮點(diǎn)數(shù)),表示目標(biāo)值。one-class SVM并不使用這個參數(shù),所以使用什么數(shù)值都可以。除非使用預(yù)計(jì)算好的內(nèi)核(稍候章節(jié)介紹),否則<index>:<value>是描述屬性值的。<index>(索引)是從1開始的整型數(shù)據(jù),而<value>(值)是實(shí)數(shù)(浮點(diǎn)型)。索引必須升序排列。在測試文件中的標(biāo)簽只是用于計(jì)算精確度或錯誤率。如果它們是未知的,那么只要將第一列賦任意數(shù)值
本包含有一個用于分類的示例數(shù)據(jù)文件,文件名是“heart_scale”。要驗(yàn)證你的數(shù)據(jù)格式的正確性,請使用“tools/checkdata.py”工具(詳見文件“tools/README”)。
鍵入“svm-train heart_scale”,程序會讀讀入訓(xùn)練數(shù)據(jù)并生成模型文件“heart_scale.model”。假設(shè)你有一個名為“heart_scale.t”的測試集,那么鍵入“svm-predict heart_scale.t heart_scale.model output”以測試預(yù)測精確度。文件“output”中含有預(yù)測的分類標(biāo)簽。
本包中還有一些別的實(shí)用程序:
svm-scale:
將輸入數(shù)據(jù)數(shù)值化的工具。
svm-toy:
簡單的圖形界面工具,它可以展示支持向量機(jī)怎樣在二維空間(即平面)上將數(shù)據(jù)分類。你可以在該窗口上面單擊以繪制數(shù)據(jù)點(diǎn)。使用“change”按鈕來選擇類別1,2或3(也就是說,最多支持三類),按“l(fā)oad”按鈕可以從文件載入數(shù)據(jù),按“save”按鈕可以將數(shù)據(jù)保存到文件,按“run”按鈕可以獲得一個SVM模型(根據(jù)繪制的點(diǎn)集或從文件載入的數(shù)據(jù)),按“clear”按鈕可以清屏。
在該窗口的底部文本框內(nèi),你可以輸入?yún)?shù),參數(shù)的句法和“svm-train”一樣。
注意:“l(fā)oad”和“save”只考慮數(shù)據(jù)分類而不考慮回歸的情況。每個數(shù)據(jù)點(diǎn)擁有一個標(biāo)簽(顏色,必須是1,2或3)和兩個屬性(橫坐標(biāo)和縱座標(biāo)),取值區(qū)間[0,1]。
本文來自CSDN博客,轉(zhuǎn)載請標(biāo)明出處:http://blog.csdn.net/jkxsanger/archive/2009/12/15/5013305.aspx
訓(xùn)練與測試數(shù)據(jù)文件的格式如下所示
<label> <index1>:<value1> <index2>:<value2>…
.
.
.
每行包含一個實(shí)例,并且以字符’/n’結(jié)束。對于分類來講,<label>是整型數(shù)據(jù),表示類別(支持多分類)。對于回歸來講,<label>是任意實(shí)數(shù)(浮點(diǎn)數(shù)),表示目標(biāo)值。one-class SVM并不使用這個參數(shù),所以使用什么數(shù)值都可以。除非使用預(yù)計(jì)算好的內(nèi)核(稍候章節(jié)介紹),否則<index>:<value>是描述屬性值的。<index>(索引)是從1開始的整型數(shù)據(jù),而<value>(值)是實(shí)數(shù)(浮點(diǎn)型)。索引必須升序排列。在測試文件中的標(biāo)簽只是用于計(jì)算精確度或錯誤率。如果它們是未知的,那么只要將第一列賦任意數(shù)值
本包含有一個用于分類的示例數(shù)據(jù)文件,文件名是“heart_scale”。要驗(yàn)證你的數(shù)據(jù)格式的正確性,請使用“tools/checkdata.py”工具(詳見文件“tools/README”)。
鍵入“svm-train heart_scale”,程序會讀讀入訓(xùn)練數(shù)據(jù)并生成模型文件“heart_scale.model”。假設(shè)你有一個名為“heart_scale.t”的測試集,那么鍵入“svm-predict heart_scale.t heart_scale.model output”以測試預(yù)測精確度。文件“output”中含有預(yù)測的分類標(biāo)簽。
本包中還有一些別的實(shí)用程序:
svm-scale:
將輸入數(shù)據(jù)數(shù)值化的工具。
svm-toy:
簡單的圖形界面工具,它可以展示支持向量機(jī)怎樣在二維空間(即平面)上將數(shù)據(jù)分類。你可以在該窗口上面單擊以繪制數(shù)據(jù)點(diǎn)。使用“change”按鈕來選擇類別1,2或3(也就是說,最多支持三類),按“l(fā)oad”按鈕可以從文件載入數(shù)據(jù),按“save”按鈕可以將數(shù)據(jù)保存到文件,按“run”按鈕可以獲得一個SVM模型(根據(jù)繪制的點(diǎn)集或從文件載入的數(shù)據(jù)),按“clear”按鈕可以清屏。
在該窗口的底部文本框內(nèi),你可以輸入?yún)?shù),參數(shù)的句法和“svm-train”一樣。
注意:“l(fā)oad”和“save”只考慮數(shù)據(jù)分類而不考慮回歸的情況。每個數(shù)據(jù)點(diǎn)擁有一個標(biāo)簽(顏色,必須是1,2或3)和兩個屬性(橫坐標(biāo)和縱座標(biāo)),取值區(qū)間[0,1]。
本文來自CSDN博客,轉(zhuǎn)載請標(biāo)明出處:http://blog.csdn.net/jkxsanger/archive/2009/12/15/5013305.aspx
總結(jié)
以上是生活随笔為你收集整理的libsvm2.9数据格式的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 用LIBSVM做回归和预测的步骤
- 下一篇: Weka学习一(分类器算法)