Python之sklearn2pmml:sklearn2pmml库函数的简介、安装、使用方法之详细攻略
生活随笔
收集整理的這篇文章主要介紹了
Python之sklearn2pmml:sklearn2pmml库函数的简介、安装、使用方法之详细攻略
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
Python之sklearn2pmml:sklearn2pmml庫(kù)函數(shù)的簡(jiǎn)介、安裝、使用方法之詳細(xì)攻略
?
目錄
sklearn2pmml庫(kù)函數(shù)的簡(jiǎn)介
1、一個(gè)典型的工作流總結(jié)
sklearn2pmml庫(kù)函數(shù)的安裝
sklearn2pmml庫(kù)函數(shù)的使用方法
1、一個(gè)簡(jiǎn)單的鳶尾物種分類決策樹模型
2、更精細(xì)的邏輯回歸模型
?
sklearn2pmml庫(kù)函數(shù)的簡(jiǎn)介
? ? ? ? sklearn2pmml是用于將Scikit學(xué)習(xí)管道轉(zhuǎn)換為PMML的Python庫(kù)。這個(gè)庫(kù)是JPMML-SkLearn命令行應(yīng)用程序的一個(gè)瘦包裝。有關(guān)支持的評(píng)估器和轉(zhuǎn)換器類型的列表,請(qǐng)參考JPMML-SkLearn特性。
?
1、一個(gè)典型的工作流總結(jié)
- 創(chuàng)建一個(gè)PMMLPipeline對(duì)象,并像往常一樣用管道步驟填充它。類sklearn2pmml.pipeline。PMMLPipeline擴(kuò)展了sklearn.pipeline類。管道具有以下功能:
- 如果PMMLPipeline。fit(X, y)方法是用panda調(diào)用的。DataFrame或熊貓。Series對(duì)象作為X參數(shù),然后它的列名用作特性名。否則,特征名稱默認(rèn)為“x1”、“x2”,..“x {number_of_features}”。
- 如果PMMLPipeline。fit(X, y)方法是用panda調(diào)用的。Series對(duì)象作為y參數(shù),然后將其名稱用作目標(biāo)名稱(對(duì)于監(jiān)督模型)。否則,目標(biāo)名稱默認(rèn)為“y”。
- 像往常一樣安裝和驗(yàn)證pipeline。
- 可選地,通過(guò)調(diào)用PMMLPipeline.verify(X)方法來(lái)計(jì)算驗(yàn)證數(shù)據(jù)并將其嵌入到PMMLPipeline對(duì)象中,該方法使用的是一個(gè)較小但有代表性的訓(xùn)練數(shù)據(jù)子集。
- 通過(guò)調(diào)用實(shí)用程序方法sklearn2pmml,將PMMLPipeline對(duì)象轉(zhuǎn)換為本地文件系統(tǒng)中的PMML文件。pmml_destination_path sklearn2pmml(pipeline)。
?
?
sklearn2pmml庫(kù)函數(shù)的安裝
pip install sklearn2pmml
pip install --user -i https://pypi.tuna.tsinghua.edu.cn/simple sklearn2pmml
?
?
?
sklearn2pmml庫(kù)函數(shù)的使用方法
1、一個(gè)簡(jiǎn)單的鳶尾物種分類決策樹模型
import pandasiris_df = pandas.read_csv("Iris.csv")iris_X = iris_df[iris_df.columns.difference(["Species"])] iris_y = iris_df["Species"]from sklearn.tree import DecisionTreeClassifier from sklearn2pmml.pipeline import PMMLPipelinepipeline = PMMLPipeline([("classifier", DecisionTreeClassifier()) ]) pipeline.fit(iris_X, iris_y)from sklearn2pmml import sklearn2pmmlsklearn2pmml(pipeline, "DecisionTreeIris.pmml", with_repr = True)?
2、更精細(xì)的邏輯回歸模型
import pandasiris_df = pandas.read_csv("Iris.csv")iris_X = iris_df[iris_df.columns.difference(["Species"])] iris_y = iris_df["Species"]from sklearn_pandas import DataFrameMapper from sklearn.decomposition import PCA from sklearn.feature_selection import SelectKBest from sklearn.impute import SimpleImputer from sklearn.linear_model import LogisticRegression from sklearn2pmml.decoration import ContinuousDomain from sklearn2pmml.pipeline import PMMLPipelinepipeline = PMMLPipeline([("mapper", DataFrameMapper([(["Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width"], [ContinuousDomain(), SimpleImputer()])])),("pca", PCA(n_components = 3)),("selector", SelectKBest(k = 2)),("classifier", LogisticRegression(multi_class = "ovr")) ]) pipeline.fit(iris_X, iris_y) pipeline.verify(iris_X.sample(n = 15))from sklearn2pmml import sklearn2pmmlsklearn2pmml(pipeline, "LogisticRegressionIris.pmml", with_repr = True)?
?
?
?
?
?
?
?
?
《新程序員》:云原生和全面數(shù)字化實(shí)踐50位技術(shù)專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結(jié)
以上是生活随笔為你收集整理的Python之sklearn2pmml:sklearn2pmml库函数的简介、安装、使用方法之详细攻略的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Python:pmml格式文件的简介、安
- 下一篇: Python之sklearn-panda