用户都跑了,你却还分不清流失用户和流失率
PMCAFF(www.pmcaff.com):互聯網產品社區,是百度,騰訊,阿里等產品經理的學習交流平臺。定期出品深度產品觀察,互聯產品研究首選。
外包大師(www.waibaodashi.com):要外包,找大師。PMCAFF旗下高質量互聯網外包解決方案提供商。外包大師服務號:waibaodashi365
作者:項宇,網易發展部用戶研究員
引言
有一個比喻非常恰當:產品如同蓄水池,用戶好比池中之水。池子中每時每刻都有新用戶源源不斷地加入,也有一部分用戶選擇離開。
如果用戶流失超過新用戶的補給,且速度越來越快、規模越來越大時,產品如若不警惕,蓄水池遲早會干涸。
?
這是用戶流失研究的背景。產品階段不同,重心也會從拉新轉移到留存,對于一個成熟的產品和飽和的市場而言,獲取一個新用戶的成本可能是留住一個老用戶的數倍,流失率的降低也意味著營收的增加,在這種條件下,流失研究的價值是顯而易見的。
?
而研究流失用戶所面臨的主要問題,是如何衡量用戶流失的規模,重中之重是梳理清楚“流失用戶”和“流失率”的定義。或許你腦海中早已經羅列好了幾點困惑:
研究對象是誰:是登錄用戶、注冊用戶,還是全部用戶的流失率?
流失周期為何:是次日流失率、7日流失率還是月流失率?
如何定義流失:1個月沒有訪問的用戶?2個月沒有下單/消費的用戶?還是3個月沒有登錄的用戶?
為了給流失一個明確、又能符合產品特征的定義,并且相對準確地識別出可能流失的用戶,我們引入二元邏輯回歸作為定量流失研究的模型。
在模型中,我們將一段時間內用戶的一系列行為特征數據(如在線天數、充值金額、積分等級、點擊次數……),代入二元邏輯回歸方程中,就可以計算出相應的流失概率。
也可以用下圖數據采集與流失預測的時間窗口來理解這一過程。選擇產品中一部分老用戶,觀察和收集他們在一個月內的行為數據(深藍色部分),通過這些數據,我們可以預測其在未來一段時間內(紅色部分)的流失與留存情況。
在預測周期1內出現但周期2未出現的,說明在周期2內流失了,如果兩個周期內都沒有出現,那么可能在觀察期內就流失了,上述兩種都屬于流失;而周期1和周期2都有出現的用戶,則是留存用戶。
但是,在通過定量模型來研究流失的過程中,往往存在著幾個常見的誤區:
概念誤區:自己研究的對象真的是流失用戶嗎?有多大比例是“偽流失用戶”(回流用戶&使用間隔大的用戶)?
方法誤區:定量模型的優化只能依賴增減指標嗎?是否數據一扔就能一勞永逸?還有哪些方法可以提升模型預測準確性?
應用誤區:流失預警模型只能用于區分流失與非流失用戶?定量數據和流失模型還可以怎樣支撐用戶細化與運營方案?
一、數據僅為工具,產品理解貫穿始終
如何界定流失用戶,避免概念誤區
在構建流失模型時,通常以月作為分析和數據提取的周期,比如在上圖時間窗口中,以連續一個月沒有使用算作流失。但這種簡單粗暴的劃分方法往往會帶來三方面的問題。
?
1、流失周期受用戶使用間隔決定,不同周期劃分影響用戶結構比例
如果以1個月作為流失周期,那么十月出現但十一月沒有出現(藍色圓點代表出現)的用戶在十一月流失了,而實際上,他在十二月又出現了,是一個回訪用戶(見回訪3),并沒有真實流失。
如果我們以2個月為周期,則“回訪3”的用戶在10~11月,12月以后兩個周期內都出現過,應該是一個留存用戶。周期劃分對用戶流失界定有著直接影響。
2、如果簡單以一個月為周期進行用戶分類,回訪用戶過多(比如占總體15%),無法忽視且難以處理
無論以何種周期劃分,必然存在一定比例的回訪用戶,將回訪用戶作為缺失值、算作留存用戶或者作為流失用戶,均對模型準確率有較大影響。
3、流失周期劃分會影響模型的準確率與平衡性
如下表,以總樣本100w為例,分別以4周、5周、6周作為流失標準,劃分出的流失和留存用戶是不同的,對應的流失留存預測準確率也不同。
流失周期過短,流失預測的準確率低,因為定義為流失的用戶中有大量實際留存的用戶,只是其使用間隔長而已(比如以1周沒登錄就算流失,但實際上很多留存用戶2~3周才登錄一次,也被劃分成流失用戶);同時周期過短,定義為留存的用戶實際上后來也會流失。
因此,不合理的周期造成預測準確率低且不平衡,我們需要不斷嘗試周期劃分,在保證整體準確率的情況下尋求流失與留存準確率最佳的平衡點,才能更為準確地同時預測流失及留存情況。
如果流失準確率有90%但留存只有50%,那么雖然我們預測流失的用戶幾乎都是真正會流失的,但可能只識別出了總體用戶中一小部分流失用戶,還有大量流失用戶被劃分在了留存用戶中,導致留存準確率過低。
在這種情況下,選擇恰當的定義方法顯得至關重要。通過查閱資料,我們發現對流失比較經典的定義是“一段時間內未進行關鍵行為的用戶”,關鍵點在于如何界定時間周期(流失周期)和關鍵行為(流失行為)。
?
我們選擇經典的拐點理論來作為周期界定的參考:
用戶回訪率拐點(用戶回訪率 = 回訪用戶數 ÷ 流失用戶數 × 100%)
同時結合對產品的理解,選擇“主動登錄”這一行為作為是否流失的關鍵行為。
?
但經典的理論也會遇到尷尬:沒有出現拐點怎么辦?
回訪率拐點可能與產品存在一個平臺期(瓶頸)有關:用戶/玩家處在哪些等級可能流失加劇,或者是在線時長達到多少會產生疲倦加劇流失,哪些角色的用戶更容易流失等等。
比如游戲,游戲的特點是:回合、關卡、任務、日常與升級,但這與一些產品長周期、長間隔的用戶使用行為模式并不相同。
在沒有拐點的情況下,可以依據產品經驗或結合模型預測準確率判斷,一般產品的回訪率5%-10%,不管劃分多長的時間周期都會存在回訪,誤差不可避免。
二、指標沒選好,模型調到老
如何優化數據模型,避免方法誤區
?
搭建數據模型的關鍵在于行為數據的選擇,這也是最耗時耗力的地方。在建立模型之前,有必要和數據&開發的同事來一次促膝談心,對數據庫和埋點的情況進行摸底,再次明確一些數據概念的操作化定義,避免發生誤解。
?
比如,誤解通常來自于以下幾點:
對活躍用戶的定義:是登錄用戶、打開app的用戶還是在線用戶?
數據映射和匹配:是按用戶維度(賬號)提取還是按照設備維度(設備ID)提取數據?如何處理一個賬戶多臺設備和一個設備多個賬戶的關系?
數據埋點:登錄用戶和匿名用戶(非登錄)埋點是否一致?某些關鍵操作(比如主動打開App)的有無準確埋點?能否區分前臺打開還是后臺打開?
數據狀態與記錄方式:能否獲取歷史數據,歷史數據是累加記錄還是覆蓋?
可問題往往沒有那么簡單,即使定義得再精確細致,模型的準確性也可能不高。如果明白“管中窺豹”這個成語的意思,你很可能找到了答案。
?
通常我們以一個月為周期,提取用戶一個月內的行為數據。但是產品不同,用戶操作習慣是大相徑庭的,有的產品1個月的時間周期太短,就難以形成足夠的行為數據,好比是盲人摸象,摸到一條尾巴要預測出是一頭大象,的確很有難度。
另一方面,時間過短部分用戶尚在好奇和探索階段,沒有完全沉淀下來成為真正的用戶。反之,如果一味增加提取數據的時間周期,項目執行的時間成本也會水漲船高;同時,等提取周期結束,一些用戶早已流失,即使預測成功也難以挽回。
?
模型的準確性依賴于數據提取周期問題的解決,我們需要一個用戶多長時間的數據才能準確預測該用戶下一階段的行為?
通過二元邏輯回歸的ROC曲線可以進行評估,如下圖,6周的數據明顯優于1個月(曲線右下方面積越大預測準確性越高),而2個月的數據只略優于6周,幅度有限,且時間成本較大,因此選擇6周作為數據提取的周期。
第二個難點在于流失原因的分析,也即流失影響因素的選擇。選擇一些具有流失用戶典型特征的指標維度作為自變量,一步步嘗試修改指標,迭代模型。
如果前期流失模型準確性低,并且流失用戶的特征與模型的特征不符,則需要尋找新的流失因素,并納入流失預警模型的提取數據點。指標的選擇,一方面需要不斷試錯,最主要還是基于對業務的理解。
建模過程中的主要問題是模型預測準確性低,我們可以通過檢查是否沒有納入典型的指標維度、是否存在多重共線性來有的放矢地加以解決,有時不顯著的原因可能出乎意料——比如產品功能更新了,或者年底積分折半了,拿到的是被污染過的數據而不自知。
?
三、不止預測:模型只是方法而非終點
如何支持用戶運營,避免應用誤區
?
通過流失預警模型,我們可以獲得產品一系列功能模塊或指標對流失留存的影響因子,并計算出每個用戶的流失概率。通過影響因子,我們可以對流失原因有所了解,在此基礎上進行深入研究和確認,結合用戶反饋的頻率、專家意見等確定改版的優先級。
計算流失概率只是一種方法,而不是研究的最終目的,流失研究也不能到此就淺嘗輒止。區分出可能流失的用戶是為了提高挽留策略的針對性,提高效率與減少成本,實現精細化運營——這也是流失模型的核心價值所在。
比如,從用戶使用的輕重程度出發(如上圖),在通過模型計算出用戶未來的流失概率后,將使用App的頻率和時長作為用戶輕重度的劃分標準,結合用戶流失留存預期,將用戶劃分為高價值、重點發展、重點轉化、有待挽留等幾種類型,分析每個類型用戶不同的行為特點和使用痛點,采取針對性的運營策略。
當然,流失模型也可結合付費維度進行研究。先篩選出極有可能將會流失的用戶,再根據購買頻次和付費金額來進行細分。
比如從未付費的用戶可通過優惠券、促銷活動或超低價商品吸引回訪、促成首單購買;少量付費且客單價低的用戶可以精準推送符合個性化偏好的商品,或者推薦符合該用戶消費層次的超值商品;多次付費的老用戶,可以增加會員專屬優惠,通過回饋激勵增強用戶粘性,延長使用周期。
以上只是流失模型的兩個層面的應用,在不同項目中還可以結合多種方式對用戶進行精細化運營。模型準確性高的話,可以用更少的成本、對用戶更少的干擾來留住更有價值的用戶。
當然,提及用戶細分、精細化運營和產品功能體驗的優化,又離不開對用戶的理解和對產品業務的積淀。和這種不斷的積淀一樣,流失預警模型也需要不斷地修正和迭代,以適應產品發展的需求。
以模型作為一種研究技術,以對用戶和業務的理解積淀作為基礎,來一起推動產品迭代和運營活動的落地,這兩者都是用戶研究的價值所在。
點擊閱讀原文,獲取5000個成熟解決方案
中高端求職 & 招聘,PMCAFF人才服務最懂你
=> alice.zhang@pmcaff.com
總結
以上是生活随笔為你收集整理的用户都跑了,你却还分不清流失用户和流失率的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 有了人工智能还不够?腾讯的工具产品想试试
- 下一篇: 老板说“我们要做个性化推荐”时,你该怎么