Dataset之OttoGroup:OttoGroup数据集的简介、下载、案例应用之详细攻略
Dataset之OttoGroup:OttoGroup數據集的簡介、下載、案例應用之詳細攻略
?
?
?
目錄
OttoGroup數據集的簡介
OttoGroup數據集的下載
OttoGroup數據集的案例應用
?
?
?
OttoGroup數據集的簡介
官網:https://www.kaggle.com/c/otto-group-product-classification-challenge/overview/description
? ? ?Otto Group數據集來源于《Otto Group Product Classification Challenge》。Otto集團是世界上最大的電子商務公司之一,在20多個國家擁有子公司,包括Crate & Barrel (USA), Otto.de (Germany) and?3 Suisses (France)。我們每天在全球銷售數百萬種產品,在我們的產品線中添加了數千種產品。
? ? ? ?我們公司對我們產品性能的一致性分析至關重要。然而,由于我們的全球基礎設施不同,許多相同的產品被分類不同。因此,我們的產品分析的質量在很大程度上取決于對類似產品進行準確分類的能力。分類越好,我們對產品范圍的了解就越多。
? ? ? ?在這次競爭中,我們為超過200000種產品提供了一個具有93項功能的數據集。目的是建立一個預測模型,能夠區分我們的主要產品類別。獲獎模型將采用開源模式。
1、電商商品分類
- –?Target:共9個商品類別
- –?93個特征:整數型特征
?
2、數據集簡介
? ? ? ? Each row corresponds to a single product. There are a total of 93 numerical features, which represent counts of different events. All features have been obfuscated and will not?be defined any further.
? ? ? ? There are nine categories for all products. Each target category represents one of our most important product categories (like fashion, electronics, etc.).?The products for the training and testing sets are selected randomly.
? ? ? ? 每行對應一個產品。共有93個數字特征,代表不同事件的計數。所有功能都已模糊化,將不再定義。
? ? ? ? 所有產品都有九個類別。每個目標類別代表我們最重要的產品類別之一(如時裝、電子等)。培訓和測試集的產品是隨機選擇的。
?
File descriptions
- trainData.csv?- the training set
- testData.csv?- the test set
- sampleSubmission.csv?- a sample submission file in the correct format
Data fields
- id?- an anonymous id unique to a?product ??產品獨有的匿名ID
- feat_1, feat_2, ..., feat_93?- the?various features of a product ? ?產品的各種特性
- target?- the class of a product ? ? ? ? ? ? ? ? ? ?產品的類別
?
OttoGroup數據集的下載
如需資料,請留言向博主索取。
?
?
?
OttoGroup數據集的案例應用
后期更新……
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的Dataset之OttoGroup:OttoGroup数据集的简介、下载、案例应用之详细攻略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ML之ME/LF:基于不同机器学习框架(
- 下一篇: ML之XGBoost:XGBoost参数