聚类算法当中的K-means算法如何去做天猫淘宝的推广任务
這個入口是全網人氣新品池,我們今天所獲取到的數據都是來源于這里。無論是C店還是B店,統統都有機會進來。這個平臺最有價值的數據,就是可以告訴我們自己的新品究竟算是什么品質的,俗稱檔次,如圖所示
不同檔位的產品,,平臺的推薦力度不同,并且這里是達人們經常選品的地方,如果能進來這里,實際上也算是多了一層曝光。
從營銷的角度來講,實際上讓產品盡量得到足夠多的曝光才是當務之急的事情。除了達人會主動推薦外,手淘首頁也會進行推薦。
這份數據圖表就是今天的案例13。重點部分內容就是這個散點圖。我們之前做過很多散點圖的同學應該都很清楚,散點圖本身不難,但如果想要讓散點圖里頭的數據都能夠自動分好類的話,似乎不是那么容易的事情。
正如上面這張圖所示,我把獲取到的快選池新品數據,按不同的關鍵詞進行分類,不同關鍵詞下都可以將數據自動分成5個類別,也就是5種不同的數據。
之所以進行分類,是因為可以更好的區別不同類別的數據特征。因此,為了達到這個效果,我使用了聚類算法當中的K-means算法。不懂算法的同學不要緊,因為微軟已經幫我們做好了一個專門來用進行數據挖掘的套件。我們暫且先來看看,究竟這些不同類別的數據都有什么特征。
數據源當中,我使用了品質檔、價格、付款人數、所在地,通過K-means算法進行聚類,最后得到5個不同的類別。這些類別的名字分別從1-5進行取名。
通過這個關系圖,我們可以很明顯看得出來,實際上分類1的數據可以直接連接分類2、3、4、5,說明其重要性不言而喻。
暫且從分類1的角度來看數據,從上面這個圖可以看出,分類1的一些特征,比如付款人數在0-299這個范圍,價格150.0-361.4這個范圍,其他的以此類推,最關鍵的地方在于這些數據背后的產品,基本上代表的就是第4檔位的產品。
而實際上,這個檔次的產品的銷量是最好的。那么也就是我們這里的分類1的產品代表的就是最好的。
從散點圖我們可以看出來,實際上這個分類被其他分類給包裹住了,哈哈。如果沒有事先進行數據挖掘的話,我們將看到一堆小圈圈在浮動。
這個是分類特征圖,基本上可以快速告訴我們數據的很多信息了。比如,檔次上來講就是集中在4和5,所在地上海就是個熱門區域。
通過我們自己做的PBI圖表,也是可以看得出來的,這里可能更加明顯。
這個數據挖掘套件的好處在于,還能告訴我們不同類別的具體特征,比如從付款人數的平均值來看,分類1在117.07,分類2在64.22,分類3在152.17等等。這樣子看數據是不是很方便了。
結合價格區間,我們也可以看出這些產品的價格段分布,基本上在106-375之間。因此,我們的定價這塊應該著重考慮這個價格段的。
因為紅酒屬于標品,因此大品牌特別多,我們可以看出來官方超市是第一位的,其次是上面這些品牌。
最后,說一下這次用到的數據,主要來自于花老師自己研發的數據分析工具箱當中的其中一項功能,如圖所示
目前為止,這個是第5代版本,一共有15個免費功能,當然隨著我后面的不斷更新,肯定會加入更多實用功能進來,盡請期待!
希望我今天的分享能對大家有所幫助,謝謝!不廢話,關注知乎專欄花隨花心,送數據分析工具箱!
發布于 2018-09-29?贊同 5??添加評論?分享?收藏?感謝?收起?總結
以上是生活随笔為你收集整理的聚类算法当中的K-means算法如何去做天猫淘宝的推广任务的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【TensorFlow】实现、训练并评估
- 下一篇: Android官方开发文档Trainin