ML.NET Cookbook:(11)如果我的训练数据不在文本文件中怎么办?
生活随笔
收集整理的這篇文章主要介紹了
ML.NET Cookbook:(11)如果我的训练数据不在文本文件中怎么办?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
對于ML.NET,通常演示的用例是當訓練數據駐留在磁盤的某個地方時,我們使用TextLoader來加載它。然而,在真實的訓練場景中,訓練數據可以在其他地方:在一堆SQL表中,從日志文件中提取,甚至動態生成。
下面是我們如何使用模式理解[1]將現有的C#IEnumerable作為數據視圖引入ML.NET。
在本例中,我們假設我們建立了客戶流失預測模型,并且我們可以從生產系統中提取以下特征:
客戶ID(模型忽略)
客戶是否有流失(目標“標簽”)
“人口統計類別”(字符串,如“年輕人”等)
最近5天的訪問次數。
有了這些信息,下面就是我們如何將這些數據轉換為ML.NET數據視圖并對其進行訓練的方法:
//?第一步:將數據加載為IDataView。 //?假設“?GetChurnData()”從某處獲取并返回訓練數據 IEnumerable<CustomerChurnInfo>?churnData?=?GetChurnInfo();var?trainData?=?mlContext.Data.LoadFromEnumerable(churnData);//?建立學習管道。 //?在我們的案例中,我們將對人口統計類別進行一次編碼,然后將其與訪問次數結合起來。 //?我們應用FastTree二進制分類器來預測“ HasChurned”標簽。var?pipeline?=//?將分類功能“DemographicCategory”轉換為獨熱編碼。mlContext.Transforms.Categorical.OneHotEncoding("DemographicCategoryOneHot",?"DemographicCategory")//?將所有分類特征轉換為索引,并構建一個“詞袋”。.Append(mlContext.Transforms.Concatenate("Features",?new[]?{?"DemographicCategoryOneHot",?"LastVisits"?}).Append(mlContext.BinaryClassification.Trainers.FastTree());var?model?=?pipeline.Fit(trainData);歡迎關注我的個人公眾號”My IO“
參考資料[1]
模式理解: https://github.com/dotnet/machinelearning/blob/main/docs/code/SchemaComprehension.md
總結
以上是生活随笔為你收集整理的ML.NET Cookbook:(11)如果我的训练数据不在文本文件中怎么办?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 记一次 .NET 某三甲医院HIS系统
- 下一篇: 怎能错过这个技术集市!转发有奖,惊喜连连