scikit-learn学习笔记(一)快速入门数据集格式和预测器
生活随笔
收集整理的這篇文章主要介紹了
scikit-learn学习笔记(一)快速入门数据集格式和预测器
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1、數據集:
數據集都是2維的,第一維度是“樣本維”,第二維度是“特征維”。
>>> from sklearn import datasets >>> iris = datasets.load_iris() >>> data = iris.data >>> data.shape (150, 4) 說明有150個樣本,每個樣本由4個特征描述。
如果原始數據不是?(m_samples,?n_features)的形狀,在使用scekit-learn之前需要預處理成2維的,常見的是圖片數據處理:
>>> digits = datasets.load_digits() >>> digits.images.shape (1797, 8, 8) 將每個8*8維的圖像轉換為feature長度為64的數據:
>>> data = digits.images.reshape((digits.images.shape[0], -1))
2、預測器:
預測器從數據集中學習,構建預測模型。
所有預測器使用fit方法從2維數據集中學習,構建模型:
>>> estimator.fit(trainData) 預測器構建好預測模型后,通過predict方法對未知數據集進行預測(分類、回歸、聚類等等):
>>> estimator.predict(textData)
當然,也可以查看預測器構建的預測模型的一些參數:
>>> estimator.estimated_param_總結
以上是生活随笔為你收集整理的scikit-learn学习笔记(一)快速入门数据集格式和预测器的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: TensorFlow学习笔记(五)Ses
- 下一篇: scikit-learn学习笔记(二)l