一种常见的关于率指标的错误分析思路
總第231篇/張俊紅
今天給大家分享一種在數據分析過程中關于率指標分析可能會犯的一種錯誤。這個問題其實很多新人都會犯,有的老人也會犯,而且很多時候錯了以后并不自知。剛好讀者群有人在問類似的問題,所以就來寫篇文章分享下。
先看個例子,如下展示了XXX公司各個渠道的留存率情況,現在如果想要看一下該公司總計的留存率情況應該怎么算呢?
直觀看上去應該有兩種算法,第一種算法是用各個渠道所有的留存用戶數÷各個渠道所有的新注冊用戶數,第二種算法是直接對三個渠道的留存率求一個平均值。那么這兩種算法有啥區別呢?算出來的結果有啥不一樣呢?如果你把上表中的數字用兩種算法算一下,算出來的結果是不一樣的。那到底哪種是正確的呢?
如果你平常是用的第一種算法,那么恭喜你,你的做法是對的,但是第二種算法錯在哪里了呢?這是因為不同渠道的新注冊用戶數是不一樣的,所以對最后結果的影響程度也是不一樣的,如果你直接對三個渠道的留存率求平均值,也就是你假設了這三個渠道最后對總留存率的影響是一樣的,但顯然是不一樣的。所以這里面引出了第三種算法,即:
試著動手算一算,用第三種算法算出來的結果和第一種算法算出來的結果是一樣的。
那如果不同渠道的新注冊用戶數是一樣的情況下時,比如下表這樣,這個時候用上面三種不同的算法算出來的結果都會是一樣的。
以上就是關于率指標分析經常會犯的一個錯誤,其實上面這種情況不僅適用于率指標,準確的來說,應該是適用于所有需要分組相除的情況,比如每個班級的平均分和年級總平均分之間的關系。希望對你有用。
總結
以上是生活随笔為你收集整理的一种常见的关于率指标的错误分析思路的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 捋一捋PDF、PMF、CDF是什么
- 下一篇: 用截断奇异值分解(Truncated S