机器学习入门实战——线性支持向量机实战digits数据集
生活随笔
收集整理的這篇文章主要介紹了
机器学习入门实战——线性支持向量机实战digits数据集
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
關于支持向量機的理論知識查看:支持向量機
digits數據集概述
digits.data:手寫數字特征向量數據集,每一個元素都是一個64維的特征向量。
digits.target:特征向量對應的標記,每一個元素都是自然是0-9的數字。
digits.images:對應著data中的數據,每一個元素都是8*8的二維數組,其元素代表的是灰度值,轉化為以為是便是特征向量。
代碼實戰
先導入數據,我們直接使用sklearn為我們準備好的數據集
from sklearn.datasets import load_digitsdigits = load_digits() digits.data.shape(1797, 64)
將數據集進行劃分
from sklearn.cross_validation import train_test_split X_train,X_test,Y_train,Y_test = train_test_split(digits.data,digits.target,test_size=0.25,random_state=33)數據標準化,導入線性支持向量機并訓練
from sklearn.preprocessing import StandardScaler from sklearn.svm import LinearSVCss = StandardScaler() X_train = ss.fit_transform(X_train) X_test = ss.fit_transform(X_test)lsvc = LinearSVC() lsvc.fit(X_train,Y_train) Y_predict = lsvc.predict(X_test)然后,我們對模型進行評估
print('The Accuracy of Linear SVC is',lsvc.score(X_test,Y_test))The Accuracy of Linear SVC is 0.948888888889
from sklearn.metrics import classification_report print(classification_report(Y_test,Y_predict,target_names=digits.target_names.astype(str)))代碼參考:《Python機器學習及實踐:從零開始通往Kaggle競賽之路》
總結
以上是生活随笔為你收集整理的机器学习入门实战——线性支持向量机实战digits数据集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux进度条脚本,Linux下简易进
- 下一篇: Linux中mysql的卸载和重装,在L