电子商务网站商品推荐案例分析
生活随笔
收集整理的這篇文章主要介紹了
电子商务网站商品推荐案例分析
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
本案例的主要目的是通過分析用戶和網站數據,使用數據挖掘技術,分析老客戶忠誠度下降的原因。
建立客戶忠誠度模型,提高其忠誠度。
一、分析方法和過程
數據來源:客戶信息、交易信息分別存放在網站數據庫的客戶表、訂單表、訂單明細中。
數據抽取:去除不需要的電話、身份證等不重要信息,抽取重要信息,如反應客戶個人身份背景、學歷等反應其交易心理的相關信息。
數據轉換:將抽取的信息轉換成能被數據挖掘算法使用的格式,放入數據倉庫中。
忠誠度計算方法:
1、忠誠:
2、忠誠變不忠誠:
3、不忠誠變忠誠:
4、不忠誠:
本月消費比前半年月平均消費降低50%,則忠誠度降一級;
本月消費比前半年月平均消費提升20%,則忠誠度升一級。
抽取之后的客戶信息表如下圖:
用戶數據不全面的處理:用戶數據填寫的不全面,重要信息可能缺失。
處理方式:根據專家系統填入缺省值、平均值、
數據轉換:如果使用ID3/C45,需要將源數據進行離散化處理。根據統計經驗,上圖的離散化結果如下圖:
本案例基于ID3進行忠誠度分類:(屬性值是點值,可以用KNN分類;屬性值是范圍值,用ID3/C45分類)。
根據ID3算法:輸入為上述已分好類的樣本數據集,輸出是代表分類規則的二叉樹或者多叉樹。
客戶群細分:
1、客戶群細分,是根據客戶行為特征或者公共屬性將客戶劃分成同類群種的過程。目的是為營銷人員實現更加精準的營銷策略、為企業提供更好的營銷戰略做支撐。
2、在客戶細分的基礎上,再簡歷客戶行為模型,建立其更加細化的、具有相同消費行為的微小群體,就能實現更加精準的營銷策略、廣告投放策略、商品推薦策略。雖然離一對一的營銷還有具體,但對企業制定營銷戰略已經具有非常強的指導意義。
3、客戶群細分可以采用人口統計學變量:年齡、性別、收入、職業、教育背景,這個可以作為初始條件。也可以采用購買行為特征變量:購買量、購買類型、購買頻次。
兩者的區別是:沒有購買行為或者購買行為數據很難獲取的情況下,比如低頻次需求(裝修),采用更加穩定的人口統計學變量。如果購買行為數據容易獲取,則建議采用購買行為作為特征變量。另外,如果是非常重要的客戶群劃分,比如投資風險偏好,則最好讓用戶自己輸入,更加能反應用戶真實需求,避免機器分類與人主觀愿望上的差別,也能避免法律上的糾紛。
4、客戶群細分,可以采用分類或者聚類實現。分類實現時,則需要營銷人員提供已經分好類的樣本;聚體實現時,則自動對客戶群進行分類。
5、決策樹等分類算法易于理解,但受限樣本劃分準確度的影響,即樣本劃分準確度會對分類解決產生重大影響。聚類算法沒有先驗知識,依靠算法人員的經驗和反復迭代得出結果,有時能得出營銷人員沒有發現的事實。
6、處理過程類似客戶忠誠度分類:從數據庫表單中提取數據;采用、去噪、清理;填入缺省值或者舍去;離散化變換;處理后的數據形如下表:
7、基于此表進行Kmeans聚類。聚類是為了推薦商品做準備的。聚類結果寫入user cluster表、cluster info,分別記錄客戶的分類(字段為客戶編號、類編號)、客戶類別所有客戶的商品購買信息(字段為類編號、商品編號、購買量)。
8、以上是根據用戶相似度,推薦相似用戶喜歡或者購買的商品。如果依據客戶本身的歷史行為做推薦,則可以挖掘大部分用戶的頻繁項集,然后根據當前用戶最近的購買行為,計算商品之間的相似度或者關聯性最強的商品,推薦給用戶。
9、推薦系統的的首要目的:結果的正確性,這就牽涉到推薦正確率要盡量高。比如80%的正確率,也就意味著20%的錯誤率,即有20%的人群會被推薦他們根本不喜歡或者不感興趣的商品,這種推薦效果產生的負面影響和損失是不好評估的。因此,我們開發的推薦系統,正確率要盡量高,盡量保持在95%以上。在這之上,提高推薦結果被用戶喜歡的程度是提高點擊轉化率、購買轉化率的關鍵因素。再進一步,如能跟用戶實時交互,則能更加快速深入理解用戶的需求,使推薦效果更好。
10、推薦系統不一定更需要這么復雜的計算過程。人工編輯的推薦商品目錄也是一種,熱門榜單也是推薦系統的一種。但是,如果想取得良好的個性化推薦效果,還是需要借助上述的自動化推薦系統,而非人工式推薦系統(專家推薦系統),這樣能產生滿足用戶個性化(用戶所屬族群)要求的推薦結果。進一步,如果能實時計算用戶的瀏覽、點擊、收藏、購買行為,并求出用戶特征,就能實現實時推薦效果,這種方式能有效提高網站的用戶體驗,提高購買轉化率,甚至省略用戶的搜索查找商品的過程。
11、實際使用過程中,這些推薦算法并不是相互矛盾排斥的,經常會綜合實用,取長補短,適應不同場景下的推薦要求。
結合多種推薦方案的推薦系統實例:針對商務網站,設計一套推薦系統。
1、在網站首頁,根據統計方法,列出前10名的熱銷商品。給新用戶和訪問者(沒有歷史數據,同時又適應所有用戶)最普世的推薦方案。
2、對已注冊、有瀏覽數據的用戶,提供更個性化的推薦結果。
3、基于用戶分類,將同類用戶中,其他用戶購買的總商品數的前N推薦給當前用戶。或者是這些商品的新品。
4、基于商品分類,找出當前用戶購買歷史商品中,最相似的商品推薦給用戶,或者通過關聯技術,找出關聯商品推薦給用戶,
5、關聯規則需要的客戶交易數據存放在網站數據庫的訂單表和訂單明細表中,通過訂單表編號到訂單明細表中查找關聯的商品,并挖掘出關聯規則。
注意事項:
1、這里的客戶忠誠度等級,可以替換為不同等級的購物欲望、電子設備發燒友、電話費消費額、手機流量等級、信用卡不同等級、股票/理財投資風險愛好不同等級、外賣送餐單價不同等級,等等形如不同等級的客戶劃分,商品劃分的分類情況。
2、對客戶忠誠度的劃分,等價于對不同客戶群的細分。劃分出的客戶群,必定對應不同的客戶特征屬性,根據這些特征屬性,就可以采用不同營銷策略,提高銷售轉化率;還可以采取不同的推薦商品,提高購買率;采取不同的廣告展示策略、提高點擊率。
3、數據特征向量過多,可以采用主成分分析、SVD奇異值分解方法降維;如果ID3過擬合,如何解決?
4、底層數據如何架構?應用層數據如何分析?數據倉庫如何架構?
5、數據如何清洗?如何去噪?不完全數據如何填入缺省值,如何舍去?
6、如何計算商品、客戶的相似度?
7、如何求最優化問題?針對什么情況?
8、Kmeans聚類計算量大,特別是用戶和特征向量都很多的時候,聚類的速度會非常慢。而且計算最佳K值時,必須不斷嘗試,才能得到K值與所有樣本點的誤差和曲線,得到最佳K值,這個計算量也是非常巨大的。建議只在一段時間內運算一次,比如一個月,得出用戶的分類情況后,就可通過ID3、KNN對待分類樣本進行分類,降低運算量提高計算速度。
建立客戶忠誠度模型,提高其忠誠度。
一、分析方法和過程
數據來源:客戶信息、交易信息分別存放在網站數據庫的客戶表、訂單表、訂單明細中。
數據抽取:去除不需要的電話、身份證等不重要信息,抽取重要信息,如反應客戶個人身份背景、學歷等反應其交易心理的相關信息。
數據轉換:將抽取的信息轉換成能被數據挖掘算法使用的格式,放入數據倉庫中。
忠誠度計算方法:
1、忠誠:
2、忠誠變不忠誠:
3、不忠誠變忠誠:
4、不忠誠:
本月消費比前半年月平均消費降低50%,則忠誠度降一級;
本月消費比前半年月平均消費提升20%,則忠誠度升一級。
抽取之后的客戶信息表如下圖:
用戶數據不全面的處理:用戶數據填寫的不全面,重要信息可能缺失。
處理方式:根據專家系統填入缺省值、平均值、
數據轉換:如果使用ID3/C45,需要將源數據進行離散化處理。根據統計經驗,上圖的離散化結果如下圖:
本案例基于ID3進行忠誠度分類:(屬性值是點值,可以用KNN分類;屬性值是范圍值,用ID3/C45分類)。
根據ID3算法:輸入為上述已分好類的樣本數據集,輸出是代表分類規則的二叉樹或者多叉樹。
客戶群細分:
1、客戶群細分,是根據客戶行為特征或者公共屬性將客戶劃分成同類群種的過程。目的是為營銷人員實現更加精準的營銷策略、為企業提供更好的營銷戰略做支撐。
2、在客戶細分的基礎上,再簡歷客戶行為模型,建立其更加細化的、具有相同消費行為的微小群體,就能實現更加精準的營銷策略、廣告投放策略、商品推薦策略。雖然離一對一的營銷還有具體,但對企業制定營銷戰略已經具有非常強的指導意義。
3、客戶群細分可以采用人口統計學變量:年齡、性別、收入、職業、教育背景,這個可以作為初始條件。也可以采用購買行為特征變量:購買量、購買類型、購買頻次。
兩者的區別是:沒有購買行為或者購買行為數據很難獲取的情況下,比如低頻次需求(裝修),采用更加穩定的人口統計學變量。如果購買行為數據容易獲取,則建議采用購買行為作為特征變量。另外,如果是非常重要的客戶群劃分,比如投資風險偏好,則最好讓用戶自己輸入,更加能反應用戶真實需求,避免機器分類與人主觀愿望上的差別,也能避免法律上的糾紛。
4、客戶群細分,可以采用分類或者聚類實現。分類實現時,則需要營銷人員提供已經分好類的樣本;聚體實現時,則自動對客戶群進行分類。
5、決策樹等分類算法易于理解,但受限樣本劃分準確度的影響,即樣本劃分準確度會對分類解決產生重大影響。聚類算法沒有先驗知識,依靠算法人員的經驗和反復迭代得出結果,有時能得出營銷人員沒有發現的事實。
6、處理過程類似客戶忠誠度分類:從數據庫表單中提取數據;采用、去噪、清理;填入缺省值或者舍去;離散化變換;處理后的數據形如下表:
7、基于此表進行Kmeans聚類。聚類是為了推薦商品做準備的。聚類結果寫入user cluster表、cluster info,分別記錄客戶的分類(字段為客戶編號、類編號)、客戶類別所有客戶的商品購買信息(字段為類編號、商品編號、購買量)。
8、以上是根據用戶相似度,推薦相似用戶喜歡或者購買的商品。如果依據客戶本身的歷史行為做推薦,則可以挖掘大部分用戶的頻繁項集,然后根據當前用戶最近的購買行為,計算商品之間的相似度或者關聯性最強的商品,推薦給用戶。
9、推薦系統的的首要目的:結果的正確性,這就牽涉到推薦正確率要盡量高。比如80%的正確率,也就意味著20%的錯誤率,即有20%的人群會被推薦他們根本不喜歡或者不感興趣的商品,這種推薦效果產生的負面影響和損失是不好評估的。因此,我們開發的推薦系統,正確率要盡量高,盡量保持在95%以上。在這之上,提高推薦結果被用戶喜歡的程度是提高點擊轉化率、購買轉化率的關鍵因素。再進一步,如能跟用戶實時交互,則能更加快速深入理解用戶的需求,使推薦效果更好。
10、推薦系統不一定更需要這么復雜的計算過程。人工編輯的推薦商品目錄也是一種,熱門榜單也是推薦系統的一種。但是,如果想取得良好的個性化推薦效果,還是需要借助上述的自動化推薦系統,而非人工式推薦系統(專家推薦系統),這樣能產生滿足用戶個性化(用戶所屬族群)要求的推薦結果。進一步,如果能實時計算用戶的瀏覽、點擊、收藏、購買行為,并求出用戶特征,就能實現實時推薦效果,這種方式能有效提高網站的用戶體驗,提高購買轉化率,甚至省略用戶的搜索查找商品的過程。
11、實際使用過程中,這些推薦算法并不是相互矛盾排斥的,經常會綜合實用,取長補短,適應不同場景下的推薦要求。
結合多種推薦方案的推薦系統實例:針對商務網站,設計一套推薦系統。
1、在網站首頁,根據統計方法,列出前10名的熱銷商品。給新用戶和訪問者(沒有歷史數據,同時又適應所有用戶)最普世的推薦方案。
2、對已注冊、有瀏覽數據的用戶,提供更個性化的推薦結果。
3、基于用戶分類,將同類用戶中,其他用戶購買的總商品數的前N推薦給當前用戶。或者是這些商品的新品。
4、基于商品分類,找出當前用戶購買歷史商品中,最相似的商品推薦給用戶,或者通過關聯技術,找出關聯商品推薦給用戶,
5、關聯規則需要的客戶交易數據存放在網站數據庫的訂單表和訂單明細表中,通過訂單表編號到訂單明細表中查找關聯的商品,并挖掘出關聯規則。
注意事項:
1、這里的客戶忠誠度等級,可以替換為不同等級的購物欲望、電子設備發燒友、電話費消費額、手機流量等級、信用卡不同等級、股票/理財投資風險愛好不同等級、外賣送餐單價不同等級,等等形如不同等級的客戶劃分,商品劃分的分類情況。
2、對客戶忠誠度的劃分,等價于對不同客戶群的細分。劃分出的客戶群,必定對應不同的客戶特征屬性,根據這些特征屬性,就可以采用不同營銷策略,提高銷售轉化率;還可以采取不同的推薦商品,提高購買率;采取不同的廣告展示策略、提高點擊率。
3、數據特征向量過多,可以采用主成分分析、SVD奇異值分解方法降維;如果ID3過擬合,如何解決?
4、底層數據如何架構?應用層數據如何分析?數據倉庫如何架構?
5、數據如何清洗?如何去噪?不完全數據如何填入缺省值,如何舍去?
6、如何計算商品、客戶的相似度?
7、如何求最優化問題?針對什么情況?
8、Kmeans聚類計算量大,特別是用戶和特征向量都很多的時候,聚類的速度會非常慢。而且計算最佳K值時,必須不斷嘗試,才能得到K值與所有樣本點的誤差和曲線,得到最佳K值,這個計算量也是非常巨大的。建議只在一段時間內運算一次,比如一個月,得出用戶的分類情況后,就可通過ID3、KNN對待分類樣本進行分類,降低運算量提高計算速度。
總結
以上是生活随笔為你收集整理的电子商务网站商品推荐案例分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Pushmail 今天你push了吗?
- 下一篇: 网文阅读付费模式为何重走回头路?