数据挖掘与数据化运营实战. 3.8 用户(买家、卖家)分层模型
3.8 用戶(買家、賣家)分層模型
用戶(買家、賣家)分層模型也是數據化運營中常見的解決方案之一,它與數據化運營的本質是密切相關的。精細化運營必然會要求區別對待,而分層(分群)則是區別對待的基本形式。
分層模型是介于粗放運營與基于個體概率預測模型之間的一種折中和過渡模型,其既兼顧了(相對粗放經營而言比較)精細化的需要,又不需要(太多資源)投入到預測模型的搭建和維護中,因而在數據化運營的初期以及在戰略層面的分析中,分層模型有著比較廣泛的應用和較大的價值。
正如預測模型有特定的目標變量和模型應用場景一樣,分層模型也有具體的分層目的和特定用途,這些具體的目的和用途就決定了分層模型的構建思路和評價依據。其常用的場景為:客戶服務團隊需要根據分層模型來針對不同的群體提供不同的說辭和相應的服務套餐;企業管理層需要基于在線交易賣家數量來形成以其為核心的賣家分層進化視圖;運營團隊需要通過客戶分層模型來指導相應的運營方案的制訂和執行,從而提高運營效率和付費轉化率等。這些分層模型既可以為管理層、決策層提供基于特定目的的統一進化視圖,又可以給業務部門做具體的數據化運營提供分群(分層)依據和參考。
分層模型常用的技術既包括統計分析技術(比如相關性分析、主成分分析等),又可以含有預測(響應、分類)模型的技術(比如通過搭建預測模型發現最重要的輸入變量及其排序情況,然后根據這些變量對分層進行大致的劃分,并通過實際數據進行驗證),這要視具體的分析目的、業務背景和數據結構而定,同時要強調的是,一個好的分層模型的搭建一定是需要業務方的參與和貢獻的,而且其中的業務邏輯和業務思考遠遠勝過分析技術本身。
下面我們分別用兩個典型的案例來說明分層模型是如何搭建和應用的。
案例一:以交易賣家數量為核心的賣家分層進化視圖
背景:某互聯網公司作為買賣雙方的交易平臺,其最終的價值體現在買賣雙方在該平臺上達成交易(從而真正讓買賣雙方雙贏,滿意)。現在,管理層希望針對在線成交的賣家(群體)形成一個分層進化的視圖。其基本目標就是,從免費注冊的賣家開始,通過該視圖可以粗略地、有代表性地勾畫出賣家一步一步成長、進步乃至最終達成交易的全過程。這里的每一層都是一個或幾個有代表性的重要指標門檻,順著不同的門檻逐步進化,越往上走,人群越少,越有可能成為有交易的賣家,而最后最高一層將是近30天來有交易的賣家。從這個背景和目標描述里,我們可以大致想象出這個分層模型是一個類似金字塔的形狀(底部人數多,越往上越小,表示人群在減少)。
這個分層模型的主要價值體現在:可以讓管理層、決策層對交易賣家的成長、進化、過濾的過程有個清晰、直觀的把握,并且可以從中直觀地了解影響賣家交易的一系列核心因素,以及相應的大致門檻閥值,也可以讓具體的業務部門直觀地了解“培養成交賣家,讓賣家能在線成交”的主要因素,以及相應的運營抓手。
在本案例中,有必要了解一些關鍵的業務背景和業務因素,比如要想在線交易,賣家的Offer必須是“可在線交易Offer”。這個條件很關鍵,所謂“可在線交易Offer”是指該商品的Offer支持支付寶等第三方在線支付手段,如果賣家的Offer不支持這些手段,那就無法在線交易,也就無法滿足本課題的目標了。所以,這里的“賣家Offer必須是可在線交易Offer”是一個前期的重要門檻和閥值,從此也可以看出,對業務背景的了解非常重要,它決定了課題是否成功。
下面來談談具體的分析思路,先是從最基本的免費注冊的賣家(即“全會員”)開始,之后是近30天有登錄網站的賣家(說明是“活”的賣家,這里經過了直觀的業務思考),再到近1年有新發或重發Offer的賣家,然后是當前有效Offer的賣家,最后是當前有可在線交易Offer的賣家,這個分析過程其實是第一部分的思考,它們構成了金字塔的下半部分,基本上是基于業務背景的了解和順理成章的邏輯來“進化”的,之所以在“全會員”與“當前有可在線交易Offer”之間安插了另外3層逐步“進化”的指標,主要也是基于業務方需要門檻的進度和細分的考慮,但這不是主要的核心點。
接下來,從“當前有可在線交易Offer的賣家”開始,層層進化到最高端的“近30天有在線交易的賣家”,也就是找出影響賣家成交的核心因素,并將之提煉成具體的層級和門檻,這一部分則是本案例的重點和核心所在。
如何找出其中的核心要素以及重要性的先后順序?在本課題中,使用了預測(分類、響應)模型的方法,即通過搭建預測(響應)模型(目標變量是“近30天是否在線成交”,輸入變量由數據分析團隊與業務團隊共同討論確定),并通過多種模型算法的比較,最后找出決定交易的幾個最重要的輸入變量及先后次序。
最終的分層模型大致如圖3-3所示,限于企業商業隱私的考慮,針對該數據做了處理,請勿對號入座。
圖3-3 交易賣家分層示意圖
該金字塔每一層里的數量代表滿足該條件的會員(賣家)數量,而且各層之間的條件是連貫且兼容的,比如,從下往上數,第6層“當前有可交易Offer”的用戶有204萬人,占其前一層“可交易行業賣家”269萬人的76%,而且該層的用戶必定是同時滿足其下5層的所有條件的(包括來自可交易行業,當前有有效Offer,近1年有新發或重發Offer,近30天有登錄網站或即時通信工具等)。
細心的讀者可能會發現,最頂層的人數是31萬,占近30天有交易賣家總數的71%,為什么不能占近30天有交易賣家總數的100%?這個差距正是由金字塔模型的本質所決定的,無論這個層層進化的金字塔模型多么完美,它還是無法完全圈定有交易賣家的總數,總是有一部分有交易的賣家不是滿足上述金字塔上半部分的那些條件、門檻、閥值。這也是類似的分層模型只能看大數、看主流的主要原因和特點,但是只要這個模型可以圈定大多數的人群(比如本項目實現的71%,或者更高),那它就有相當的代表性,就可以作為相應的決策參考和業務參考。
當然,這個模型是否可以投入應用,還需要進一步檢驗,常規的檢驗方法就是通過不同時間段的數據,看是否有相似的規律、門檻、占比、漏斗,也就是看這個金字塔的結構是否具有一定時間長度的穩定性。在本項目中,我們通過前后各半年的數據分別進行了驗證,發現這個金字塔的結果總體還是比較穩定的,確實可以作為決策參考和業務借鑒。
案例二:客戶服務的分層模型
背景:A產品是一個在線使用的付費產品,其主要功能就是讓賣家實時獲悉來自己網店的買家,可以讓賣家通過主動對話促成雙方的交談,一旦對上話,賣家就可以得到由系統提供的買家聯系方式等。很明顯,該產品的核心功能(賣點)就是讓賣家第一時間抓住來店鋪的買家,并通過對話拿到買家的聯系方式,方便后期的跟進,直至達成交易。現在該產品的客戶服務團隊正在負責付費用戶的后期續費工作,該客服團隊希望數據分析師幫他們制作一個付費用戶的分層模型,在業務方的設想中該模型至少有3層,每一層可以對應相應的客服方案來幫助該層客戶解決問題,模型的最終目的是促進付費客戶的續費率穩步提升。具體來說,業務方希望根據業務敏感和客服資源儲備,對付費用戶進行3個群體的劃分,每個群體有明確的業務診斷和客服方案(第一個群體,“體質差的客戶群體”,比如訪客數比較少,并且客戶登錄在線平臺的次數也比較少(導致雙方握手交談可能性不高),這群客戶被認為是最次要關注的;第二個群體,“問題客戶群體”,比如對該產品的功能點使用都很少的客戶,針對這群客戶,客服團隊可以對他們提供有針對性的產品功能教育;第三個群體,“生死線客戶”,這群客戶特點是有相對而言數量較多的訪客,但是他們很少主動洽談(以至無法拿到買家的聯系方式,影響后期的成交),之所以稱之為“生死線客戶”,是因為客服團隊希望作為重點關懷的群體,把他們從產品使用的“無效性”上拉回來,把他們從可能流失(續費)的生死線上拉回來(這群客戶有理由從產品中獲益(拿到買家聯系方式),只是他們沒有主動聯系客戶,如果他們能主動與買家洽談,從而拿到聯系方式,他們的成交業務有理由明顯上升)。
該案例的分層模型用不上復雜的建模技術,只需要基于簡單的統計技能就可實現。在深度把握產品價值和業務背景的前提下,我們與業務方一起基于他們設想的3個細分群體,根據實際數據找出了相應的具體閥值。具體來說,針對“體質差的客戶群體”,基于訪客數量和自身登錄平臺的天數和次數,進行兩維數據透視,就可以找到滿意的閥值和門檻定義;針對“問題客戶群體”,只需要針對各功能點使用情況的10分位,找出最低的20%~30%用戶就可以了;針對“生死線客戶群體”,同樣是基于訪客數量和自身主動洽談的次數,進行兩維數據透視,也可以找到滿意的閥值和門檻定義,這樣就能根據數據分布情況找到有很多訪客,同時主動洽談次數很少的客戶群體。上述群體劃分的方法主要是基于業務理解和客服團隊的資源配備的,事后的方案驗證也表明,該種群體劃分不僅能讓業務方更容易產生理解和共鳴,也能很好地穩定并提升付費用戶的續費率。
總結
以上是生活随笔為你收集整理的数据挖掘与数据化运营实战. 3.8 用户(买家、卖家)分层模型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《网站性能监测与优化》一2.3 协作网站
- 下一篇: 《贝叶斯方法:概率编程与贝叶斯推断》一导