當前位置：首頁 > 编程语言 > asp.net >内容正文

asp.net

ML.NET Cookbook：（11）如果我的训练数据不在文本文件中怎么办？

發布時間：2023/12/4 asp.net 36 豆豆

生活随笔收集整理的這篇文章主要介紹了 ML.NET Cookbook：（11）如果我的训练数据不在文本文件中怎么办？小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

對于ML.NET，通常演示的用例是當訓練數據駐留在磁盤的某個地方時，我們使用TextLoader來加載它。然而，在真實的訓練場景中，訓練數據可以在其他地方：在一堆SQL表中，從日志文件中提取，甚至動態生成。

下面是我們如何使用模式理解^[1]將現有的C#IEnumerable作為數據視圖引入ML.NET。

在本例中，我們假設我們建立了客戶流失預測模型，并且我們可以從生產系統中提取以下特征：

客戶ID（模型忽略）
客戶是否有流失（目標“標簽”）
“人口統計類別”（字符串，如“年輕人”等）
最近5天的訪問次數。

private?class?CustomerChurnInfo {public?string?CustomerID?{?get;?set;?}public?bool?HasChurned?{?get;?set;?}public?string?DemographicCategory?{?get;?set;?}//?最近5天內的訪問，最早到最新。[VectorType(5)]public?float[]?LastVisits?{?get;?set;?} }

有了這些信息，下面就是我們如何將這些數據轉換為ML.NET數據視圖并對其進行訓練的方法：

//?第一步：將數據加載為IDataView。 //?假設“?GetChurnData（）”從某處獲取并返回訓練數據 IEnumerable<CustomerChurnInfo>?churnData?=?GetChurnInfo();var?trainData?=?mlContext.Data.LoadFromEnumerable(churnData);//?建立學習管道。 //?在我們的案例中，我們將對人口統計類別進行一次編碼，然后將其與訪問次數結合起來。 //?我們應用FastTree二進制分類器來預測“ HasChurned”標簽。var?pipeline?=//?將分類功能“DemographicCategory”轉換為獨熱編碼。mlContext.Transforms.Categorical.OneHotEncoding("DemographicCategoryOneHot",?"DemographicCategory")//?將所有分類特征轉換為索引，并構建一個“詞袋”。.Append(mlContext.Transforms.Concatenate("Features",?new[]?{?"DemographicCategoryOneHot",?"LastVisits"?}).Append(mlContext.BinaryClassification.Trainers.FastTree());var?model?=?pipeline.Fit(trainData);

歡迎關注我的個人公眾號”My IO“

參考資料

[1]

模式理解: https://github.com/dotnet/machinelearning/blob/main/docs/code/SchemaComprehension.md

總結

以上是生活随笔為你收集整理的ML.NET Cookbook：（11）如果我的训练数据不在文本文件中怎么办？的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：记一次 .NET 某三甲医院HIS系统
下一篇：怎能错过这个技术集市！转发有奖，惊喜连连