weka使用训练集分类测试集_weka实验报告
基于weka的數據分類分析實驗報告
姓名:學號:
1實驗基本內容
本實驗的基本內容是通過使用weka中的三種常見分類方法(樸素貝葉斯,KNN和決策樹C4.5)分別在訓練數據上訓練出分類模型,并使用校驗數據對各個模型進行測試和評價,找出各個模型最優的參數值,并對三個模型進行全面評價比較,得到一個最好的分類模型以及該模型所有設置的最優參數。最后使用這些參數以及訓練集和校驗集數據一起構造出一個最優分類器,并利用該分類器對測試數據進行預測。
2數據的準備及預處理
2.1格式轉換方法
原始數據是老師直接給的arff文件,因此不用轉換,可以直接導入。但如果原始數據是excel文件保存的xlsx格式數據,則需要轉換成Weka支持的arff文件格式或csv文件格式。由于Weka對arff格式的支持更好,這里我們選擇arff格式作為分類器原始數據的保存格式。
轉換方法:假如我們準備分析的文件為“breast-cancer.xlsx”,則在excel中打開“breast-cancer.xlsx”,選擇菜單文件->另存為,在彈出的對話框中,文件名輸入“breast-cancer”,保存類型選擇“CSV(逗號分隔)”,保存,我們便可得到“breast-cancer.csv”文件;然后,打開Weka的Exporler,點擊Open file按鈕,打開剛才得到的“filename”文件,點擊“save”按鈕,在彈出的對話框中,文件名輸入“breast-cancer”,文件類型選擇“Arff data files(*.arff)”,這樣得到的數據文件為“breast-cancer.arff”。
總結
以上是生活随笔為你收集整理的weka使用训练集分类测试集_weka实验报告的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mac硬盘空间不足
- 下一篇: 使用STM32进行Flash地址空间的数