Python:pmml格式文件的简介、安装、使用方法(利用python将机器学习模型转为Java常用的pmml格式文件)之详细攻略
Python:pmml格式文件的簡介、安裝、使用方法(利用python將機器學習模型轉為Java常用的pmml格式文件)之詳細攻略
?
?
?
?
目錄
pmml格式文件的簡介
1、PMML結構 ?
pmml安裝
pmml格式文件的使用方法
1、將訓練好的模型轉化為PMML文件
?
?
?
pmml格式文件的簡介
? ? ? ?PMML(Predictive Model Markup Language)主要是作為分析模型訓練實例的載體,截至到PMML 4.2版本,支持的模型包括:關聯規則、基線模型、決策樹、聚類、回歸、KNN、神經網絡、貝葉斯、記分牌、序列、文本、時間序列、規則集和SVM。 ?PMML使用統一的規范進行驗證,使用XSD進行詞法驗證,使用XSLT進行語法驗證,在構造和解析的時候都要依照統一的PMML規范操作。
? ? ? ?PMML 是一種事實標準語言,用于呈現數據挖掘模型。預測分析模型 和數據挖掘模型 是指代數學模型的術語,這些模型采用統計技術了解大量歷史數據中隱藏的模式。預測分析模型采用定型過程中獲取的知識來預測新數據中是否有已知模式。PMML 允許您在不同的應用程序之間輕松共享預測分析模型。因此,您可以在一個系統中定型一個模型,在 PMML 中對其進行表達,然后將其移動到另一個系統中,并在該系統中使用上述模型預測機器失效的可能性等。
? ? ? ?簡單來說,PMML就是在一個平臺訓練好模型,然后封裝成PMML文件,然后再在另一個平臺中可以直接使用訓練好的模型。PMML 是數據挖掘群組的產物,該群組是一個由供應商領導的委員會,由各種商業和開放源碼分析公司組成。因此,現在的大部分領先數據挖掘工具都可以導出或導入 PMML。作為一個已發展 10 多年的成熟標準,PMML 既可以呈現用于從數據中了解模型的統計技術(如人工神經網絡和決策樹),也可以呈現原始輸入數據的預處理以及模型輸出的后處理。
?
1、PMML結構 ?
- a) PMML標簽 ?PMML的命名空間定義如下: ?xmlns="http://www.dmg.org/PMML-4_2" ?
- b) Header標簽 ?Header標簽標識著PMML正文的開始,可以包含copyright、描述、名稱等信息,可以添加時間戳、注解等元素。
- c) MiningBuildTask ?此元素包含構造模型實例的配置信息,一般是SQL或Java片段。 ?
- d) DataDictionary ?此元素包含挖掘模型的每個屬性信息,通過DataDictionary基本可以確定模型的規模。在DataDictionary中的DataField的name必須在DataField和DerivedField的name中唯一。 ?
- e) TransformationDictionary ?TransformationDictionary主要用于從原數據到模型使用數據之間的映射,支持的映射包括正規化、離散化、數值映射、詞頻、定義函數和聚集。?
?
?
pmml安裝
Python之pypmml:pypmml的簡介、安裝、使用方法之詳細攻略
?
?
?
?
pmml格式文件的使用方法
1、將訓練好的模型轉化為PMML文件
利用XGBoost模型對Iris數據訓練并轉為PMML文件,載入并實現預測
?
?
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的Python:pmml格式文件的简介、安装、使用方法(利用python将机器学习模型转为Java常用的pmml格式文件)之详细攻略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python之sklearn-pmml:
- 下一篇: Python之sklearn2pmml: