當(dāng)前位置：首頁(yè) > 编程语言 > python >内容正文

python

Python之sklearn2pmml：sklearn2pmml库函数的简介、安装、使用方法之详细攻略

發(fā)布時(shí)間：2025/3/21 python 28 豆豆

生活随笔收集整理的這篇文章主要介紹了 Python之sklearn2pmml：sklearn2pmml库函数的简介、安装、使用方法之详细攻略小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Python之sklearn2pmml：sklearn2pmml庫(kù)函數(shù)的簡(jiǎn)介、安裝、使用方法之詳細(xì)攻略

sklearn2pmml庫(kù)函數(shù)的簡(jiǎn)介

1、一個(gè)典型的工作流總結(jié)

sklearn2pmml庫(kù)函數(shù)的安裝

sklearn2pmml庫(kù)函數(shù)的使用方法

1、一個(gè)簡(jiǎn)單的鳶尾物種分類決策樹模型

2、更精細(xì)的邏輯回歸模型

sklearn2pmml庫(kù)函數(shù)的簡(jiǎn)介

? ? ? ? sklearn2pmml是用于將Scikit學(xué)習(xí)管道轉(zhuǎn)換為PMML的Python庫(kù)。這個(gè)庫(kù)是JPMML-SkLearn命令行應(yīng)用程序的一個(gè)瘦包裝。有關(guān)支持的評(píng)估器和轉(zhuǎn)換器類型的列表，請(qǐng)參考JPMML-SkLearn特性。

1、一個(gè)典型的工作流總結(jié)

創(chuàng)建一個(gè)PMMLPipeline對(duì)象，并像往常一樣用管道步驟填充它。類sklearn2pmml.pipeline。PMMLPipeline擴(kuò)展了sklearn.pipeline類。管道具有以下功能:
如果PMMLPipeline。fit(X, y)方法是用panda調(diào)用的。DataFrame或熊貓。Series對(duì)象作為X參數(shù)，然后它的列名用作特性名。否則，特征名稱默認(rèn)為“x1”、“x2”，..“x {number_of_features}”。
如果PMMLPipeline。fit(X, y)方法是用panda調(diào)用的。Series對(duì)象作為y參數(shù)，然后將其名稱用作目標(biāo)名稱(對(duì)于監(jiān)督模型)。否則，目標(biāo)名稱默認(rèn)為“y”。
像往常一樣安裝和驗(yàn)證pipeline。
可選地，通過(guò)調(diào)用PMMLPipeline.verify(X)方法來(lái)計(jì)算驗(yàn)證數(shù)據(jù)并將其嵌入到PMMLPipeline對(duì)象中，該方法使用的是一個(gè)較小但有代表性的訓(xùn)練數(shù)據(jù)子集。
通過(guò)調(diào)用實(shí)用程序方法sklearn2pmml，將PMMLPipeline對(duì)象轉(zhuǎn)換為本地文件系統(tǒng)中的PMML文件。pmml_destination_path sklearn2pmml(pipeline)。

sklearn2pmml庫(kù)函數(shù)的安裝

pip install sklearn2pmml
pip install --user -i https://pypi.tuna.tsinghua.edu.cn/simple sklearn2pmml

sklearn2pmml庫(kù)函數(shù)的使用方法

1、一個(gè)簡(jiǎn)單的鳶尾物種分類決策樹模型

import pandasiris_df = pandas.read_csv("Iris.csv")iris_X = iris_df[iris_df.columns.difference(["Species"])] iris_y = iris_df["Species"]from sklearn.tree import DecisionTreeClassifier from sklearn2pmml.pipeline import PMMLPipelinepipeline = PMMLPipeline([("classifier", DecisionTreeClassifier()) ]) pipeline.fit(iris_X, iris_y)from sklearn2pmml import sklearn2pmmlsklearn2pmml(pipeline, "DecisionTreeIris.pmml", with_repr = True)

2、更精細(xì)的邏輯回歸模型

import pandasiris_df = pandas.read_csv("Iris.csv")iris_X = iris_df[iris_df.columns.difference(["Species"])] iris_y = iris_df["Species"]from sklearn_pandas import DataFrameMapper from sklearn.decomposition import PCA from sklearn.feature_selection import SelectKBest from sklearn.impute import SimpleImputer from sklearn.linear_model import LogisticRegression from sklearn2pmml.decoration import ContinuousDomain from sklearn2pmml.pipeline import PMMLPipelinepipeline = PMMLPipeline([("mapper", DataFrameMapper([(["Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width"], [ContinuousDomain(), SimpleImputer()])])),("pca", PCA(n_components = 3)),("selector", SelectKBest(k = 2)),("classifier", LogisticRegression(multi_class = "ovr")) ]) pipeline.fit(iris_X, iris_y) pipeline.verify(iris_X.sample(n = 15))from sklearn2pmml import sklearn2pmmlsklearn2pmml(pipeline, "LogisticRegressionIris.pmml", with_repr = True)

《新程序員》：云原生和全面數(shù)字化實(shí)踐50位技術(shù)專家共同創(chuàng)作，文字、視頻、音頻交互閱讀

總結(jié)

以上是生活随笔為你收集整理的Python之sklearn2pmml：sklearn2pmml库函数的简介、安装、使用方法之详细攻略的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Python：pmml格式文件的简介、安
下一篇： Python之sklearn-panda