数据分析思维扫盲
知識來源:接地氣學堂1
前言
行文之初衷,建立知識樹,因而不易速讀,請君悉知。宜為工具書,按索引取之。獨學而無友,必孤陋寡聞,請君賜教,不吝感激。循序圖之,
數據分析介紹
- 前言
- 一、基本認識
- 1. 數據分析定義
- 2. 需求層的工作概述
- 3.數據層工作概述
- 4.分析層工作概述
- 5.輸出層工作概述
- 7.技術與能力
- 其他概念
- 數據賦能
- 數據產品
- 二.數據分析可以解決問題類型:
- 1.“是多少”問題的解決思路
- 2.“是什么”問題的解決方法
- 3.“為什么”問題的解決方法
- 4.“會怎樣”問題的解決方法
- 5.屬于“怎么做”的方法
- 總結
- 三.數據分析思路如何建立
- 分析的思路建立
- 1. 理解業務——工作的前提
- 2.需求分析 —— 分析的前提
- 3.開展分析工作——核心工作
- 4.落地方法——最重要環節
- 5.復盤經驗
- 案例:
- 四.建立指標體系
- 1. 主指標(一級指標)
- 2.結構框架(二級/三級指標)
- 3.判斷標準
- 4.使用指標體系診斷問題
- 5.建立指標常見問題
- 五.數據報告
- 1.明確前提
- 2.你問我答- 報告要點
- 3.我說你聽,報告要點
- 4.失敗的報告
- 5.如何寫建議
- 6.報告格式參考
- 六.數據分析與運營體系
- 1.運營特點
- 2.數據運營
- 3.數據運營體系搭建方法
- 4.根據KPI設定目標的方式
- 5.如何支持運營迭代
- 6.事后如何目標數據
- 7.如何給運營提建議
- 8.遇到人為阻力,如何解決?
- 9.復雜任務
- 七.數據標簽
- 1.打標簽
- 2.標簽發揮作用
- 3.用戶標簽
- 八.用戶畫像
- B2C用戶畫像
- B2B的用戶畫像
- 九數據處理
- 1.數據探索 Explore
- 2.數據修正 Modify
- 3.數據轉化
- 4.工具
- 十.分析方法
- 1.數學分析框架
- 單維分析
- 多維分析
- 分類分析
- 流程法
- 相關性分析
- 聚類分析
- 回歸分析
- 其他
- 2.行業與公司框架
- **從哪里獲取研究所需的報告和數據**
- 3.電商數據分析
- 用戶分析
- 客戶生命周期模型
- AARRR
- RFM:
- TGI指數
- 其他:
- 商品分析
- 杜邦分析法
- ABC 分類法
- **場景分析(產品)**
- **轉化漏斗**
- 場景分析(營銷)
- 渠道分析
- 十一、數據可視化 visualization
- 常用圖形
- 十二、常見指標
- 1. 用戶指標
- 2.商品指標
- 3.產品指標
- 4.營銷指標
- 十三 工具偏
- 1. 網站分析工具
- 2.移動端分析工具
- 番外篇:基本素養
- 醫者意識
- 指標意識
- 業務意識
- 溝通意識
- 工程思維
- 超模板意識
一、基本認識
1. 數據分析定義
根據分析目的,用統計學的從數據中尋找信息形成結論。
-
工作對象
驅動業務:利用數據落地運營方法.具體的運營崗位提供相應的服務。包含,但不限于:提供報告報表、數據賦能、專題分析、數據產品。 -
數據分析與挖掘的大致關系
數據挖掘是分析的一種方式,統計學/機器學習的方法只是解決分析問題的工具一般數據分析數據挖掘 定義 分析方法業務模型,評估現狀和修正不足 分析側重于數學模型,發現未知的模式 和規律 側重 實際的業務知識 挖掘技術的落地,完成“采礦”過程 技能 統計學、數據庫、Excel、可視化等 過硬的數學功底和編程技術 結果 需結合業務知識解讀統計結果 模型或規則 -
工作流程
需求層——數據層——分析層——輸出層
2. 需求層的工作概述
- 定義:基于對業務的理解,決定分析的整體方向
- 目標:最終要弄清,需要分析什么問題,怎么分析,要什么數據。
- 流程:理解業務——理解需求——建立分析計劃
3.數據層工作概述
- 定義:處理數據,工作量最大,數據分析人的基本功,最浪費時間。
- 要求:能得出適合分析的數據格式。
- 工作:數據采集——數據探索——數據處理
- 數據采集
常用的搜集手段有:從數據庫里取數、從業務指標當中取數,或者說從數據場景當中去取,問卷調查 、實驗室試驗、儀器設備的記錄 - 數據探索:把握數據的全面性和純度。
全面性:整體把握字段數、字段類型。是否包含了所有我們需要的字段,字段的數據分布。
純度:具體每個字段把握:臟數據,數據范圍、格式和缺失程度。注意異常數據的規律,是否代表著某種特殊情況。 - 數據處理
應用工具清洗、整理、加工數據,主要方式: 增、刪、改、查、計算。數據類型的轉換 、數據的一致性處理 、 異常值和缺失值的處理 、數據形態的轉換
- 數據采集
4.分析層工作概述
- 是什么:開始分析工作,最考驗我們數據分析人思維的一個層級
- 要求:得出合理的結論
- 工作:方法+軟件+業務,根據擬定的計劃使用數據分析工具展開具體的分析
5.輸出層工作概述
- 是什么:展現信息/結論+落地方法+復盤經驗。
- 包括:結論—建議—執行—反饋—改進。
7.技術與能力
| 統計學 | |||
| 概率論 | |||
| 溝通表達 | |||
| 思維框架 | |||
| 業務能力: | 各方業務知識 | ||
| 電子商務 | |||
| 用戶運營 | |||
| 商品運營 | |||
| 工程能力 | |||
| 數據搜集 | SQL | ||
| 數據清洗與探索 : | Excel | ||
| Python | |||
| KETTLE | |||
| 數據建模 : | Python | ||
| 數據呈現 : | PPT | ||
| BI | |||
| Excel |
其他概念
關于數據工作的概念層出不窮,但萬變不離其宗,數據分析思維是解決一切的核心
數據賦能
所謂數據分析賦能業務,可以做的是:
一量化現狀,為賦能打下基礎
二梳理問題,為賦能方向指路
三展開分析,為賦能優化效率
四監控進度,為賦能保駕護航
五總結經驗,為賦能積累成果
賦能的直觀含義,就是增強業務能力,提高業務效率。注意:賦能是用更高級的手段解決戰斗,不是替代,更不是“你行你上啊”
“二營長,你他娘的意大利炮呢!”——這就是最直觀的賦能。沒有意大利炮能不能打縣城?能,當然能,李團長手下上萬人馬呢。可沒有意大利炮,打城門口很累,要死很多人。戰士們扛著梯子沖了那么多次都沖不下來。有了意大利炮,“咣!”一下就搞掂了,就損失一個老婆,這個投入產出比顯著提升
15年前我們說數據賦能業務,大部分談的是如何給領導做儀表盤,給業務員做跟進工具,做推薦算法、做響應算法提高外呼成功率,因為那個時代企業數據建設普遍落后。真的是沒數據可用,所以需要做大量基礎建設。
現在說數據賦能,大部分談的是如何讓業務方重視、尊重、科學利用數據。我們看到的企業實際情況,是驕兵悍將不屑于看數據,蝦兵蟹將學也學不會。最后數據報表不是沒人看,就是淪為“證明老子很牛逼”的工具。完全沒有派上應有的用處。當然是得想辦法積極投身到和業務的溝通中去。平時多做科普(比如多多轉發陳老師文章)讓大家知道數據到底是干啥的,有啥用,能咋樣用。在遇到項目的時候爭取參與機會,從基礎做起,不斷提高業務方使用率,不斷積累在業務上助力經驗。
數據產品
真實的產品,是一個廣泛的概念,并非是死板的BI+儀表盤。因為,業務使用頻率和認可度,是第一位的。很多做數據的同學一提數據產品,就想著搞花里胡哨的儀表盤,很容易讓數據產品變成“為做而做”,最后打開率不高,更不指望別人說自己好了。換句話說,只要業務能用起來,數字輸出到哪里,炫酷不炫酷,根本沒那么重要。
二.數據分析可以解決問題類型:
復雜問題是簡單問題的疊加
1.“是多少”問題的解決思路
-
工作:要用數據描述狀況。
-
單指標思路
只用1個指標就能描述清楚狀況,比如身高、年齡這種,是沒有什么分析方法的,注意描述的維度:時間、角度。 -
多指標思路
描述很多指標,涉及:重點指標選擇,指標展示方式。描述性方法:- AARRR:
AARRR都是圍繞用戶來說的,實際上只適用于用戶運營,不是所有業務都能硬插這五個指標的。互聯網行業增長黑客理論的五個大指標。
需要注意的是,實際用的時候,還有很多二級、三級小指標,絕不是五個指標就完事了,切記。 - 漏斗法:
圍繞流程環節,任何流程都能擺一個漏斗出來,主要用來衡量流程轉化率的指標。比如:互聯網廣告(站外頁-落地頁-促進頁-轉化頁),B2B銷售的售前流程也很長(銷售線索-初次接觸-溝通需求-展示demo-議價-競標-簽署合同),擼出來一個漏斗。 - 杜邦分析法:
用來拆解經營指標:原本是財務分析中用來衡量企業經營效益與財務指標的方法,現在被推廣到拆解。比如銷售金額=用戶數付費率客單價。然后再層層拆解用戶數,客單價構成。有意思的是,杜邦分析法拆出來的邏輯圖會很復雜,所以很多人為了提高逼格直接把它叫“分析模型”…… - 量、收、利、進、銷、存:零售行業,無論線上線下都是這六個關鍵指標:總量、收入、利潤、采購(進)、存貨。和AARRR一樣,有一堆二級三級小指標。
- AARRR:
-
要注意
以上都是描述問題的方法,并沒有解答問題,比如看到用戶流失率75%所以呢?所以75%是好還是壞呢?描述+標準才能對問題做判斷。所以才有了下邊“是什么”的方法。
2.“是什么”問題的解決方法
-
工作:“是什么”主指樹立數據標準的方法,也包括定位對象(是誰、在哪里)
-
解決思路:可以純粹基于數學尋找標準,但實際中更多是基于業務經驗,但業務經驗也需要數據進行驗證才知道是對的錯的。因此,產生了“是什么”的兩個步驟:探索標準的方法,驗證標準的方法:
- 探索標準
和到底要對幾個指標進行探索有關。- 1個指標——切割線擺在哪,方法有:二八法、十分位法、ABC法。名字聽著玄妙,當我們沒有信心的時候,可以根據二八定律,把切割線擺在20%,也可以先拆10組或者若干組出來,探索下擺在哪里合適。
- 2個指標——矩陣法,其實就是把兩個指標交叉,分出四個象限,看看四類有沒有明顯特點。
- 超過3個指標,用一些統計學的方法。在無標注的情況下可以用Kmean聚類進行分類探索,在有標注情況下可以用決策樹。一般不建議直接交叉。即使只有3個指標,每個指標分3類,也會產生 333=27 類出來,在業務上太復雜了。由此可以看書:統計學/機器學習的方法只是解決分析問題的工具,就是這個意思。
- 驗證標準
找出來標準需要業務方來驗證。好的標準要能清晰區分不同群體。比如女生說要相親的男生身高180。那意味著179的人她真的不要,181她不會立即拒絕。如果176的她照樣接受,就說明畫出來標準沒有區分度,要么是標準劃分出了問題,要么就是做標準的指標壓根就找錯了。 -
注意: 有沒有用數據找標準,有沒有驗證過業務部門的標準,是從取數到分析的分水嶺。 很多同學覺得自己沒有做分析,不知道分析的是什么,核心原因就是手上只有數據沒有標準。
比如跑出來一個:本月底銷售額3000萬,可3000萬又怎樣呢?不知道。然而渠道部一看到月底銷售額3000萬,就大喊一聲:肯定是華東大區藏了業績,下個月頭他們至少還要吐500萬出來!這就是有沒有評價標準的差距。所以平時工作中就得養成強烈的標準意識,這樣才能進行真正的分析。
3.“為什么”問題的解決方法
-
工作: “為什么”指探索問題原因。
-
方法:很難僅通過數據鎖定原因,是一個系統的過程,需要做齊量化-探索-假設-檢驗-總結全套流程,往往要內部數據+外部調研+業務判斷+測試,共同努力鎖定原因。嚴格來說,這里不是靠某個分析方法得出的結論,想僅通過數據分析找原因,是相當困難的,這一點切記切記。但是考慮到面試官還是很想聽幾個方法的名字的,我們可以這么說,找原因的方法可以分作經驗推斷與算法推斷兩種:
- 經驗推斷就是經典的:歸納法與演繹法,具體到數據操作上,就是分組對比(歸納原因)和趨勢推演(演繹判斷)。實際中,當然是兩種方法結合,不斷逼近真相。比如:問為什么銷售額下降,用歸納法就是將每一次銷售下降的時候,相關癥狀指標列出來,然后做分組對比,看哪個因素影響下跌的厲害。用演繹法,就是假設銷售下降就是因為人員流失/引流產品不給力/季節因素導致的,那么我做了相應調整:人員調動/上新品/等季節過去,以后應該銷售能回升。
- 算法推斷:通過指標的計算發現潛在問題點,然后回歸到業務里去驗證,不是靠人工智能阿爾法大狗子汪汪一叫就把原因叼回來。可以簡單理解為把上邊經驗推斷的過程,量化為一堆指標的計算。比如相關分析雖然不能證明因果,但是能提供分析假設,拿到假設以后我們就能進一步驗證,到底這種關系是真相關還是偽相關。因此,做分類的模型與計算相關系數的統計方法,理論上都能用來做這種探索
-
注意:統計上的相關系數與業務中的相關關系是兩碼事
- 一提探索原因,大家腦子自然蹦出來的就是相關分析……往往會以為計算個相關系數,丫就真的相關了。于是產生了“龍脈梗”2。面試的時候經常有同學在這里吹牛吹大了,被懟得體無完膚。相關系數在數學基礎掃盲(12.4中有)
4.“會怎樣”問題的解決方法
- 工作:指預測業務走勢。
- 方法:首先大類上,預測分定性預測和定量預測兩種。
-
定性方法是基于業務經驗和業務假設,來推測未來走勢,并不全是拍腦袋,因為定性假設選取的場景和參數可以通過分析來獲得,并不是完全沒有依據。同時,對業務部門而言,定性預測時責權劃分非常清晰,每個部門要做到多少業績一清二楚,反而容易推動執行有兩種推測法。
- 經驗推斷法,一種是找一個類似的業務場景進行推測。比如馬上上一款新產品,根據過往的經驗,一般上市后T+N周銷售走勢應該是XX,所以類似的也該是這樣。
- 基于業務假設,比如新產品上市,假設推廣部門傳播力度為X,假設銷售部門配備人員為Y,假設供應鏈的產品到貨率是Z,之后套入杜邦分析法的模型進行計算,綜合預測銷量。
-
定量的方法又分為基于時間的時間序列法,與基于因果關系的算法兩類。比如比如預測店鋪銷量,如果用時間序列法,則根據過往1-3年銷量數據來預測未來的銷售數據。如果基于因果關系,則要引入與銷售結果相關的變量(多元回歸),比如店鋪位置、店鋪產品線、產品價格、顧客評價、顧客人數等等。
- 注意:工作中真正操作的時候,要因地制宜選方法。
- 定量預測看起來很復雜,很多同學會直觀的認為復雜就是牛逼的。可實際操做過幾次就會發現,**時間序列法對于環境變化不敏感,**容易被突發事件沖擊。因果關系法可能采集不到足夠的數據,導致模型預測精度很難上去。所以在工作中真正操作的時候,要因地制宜選方法。在面試的時候,要客觀陳述建模效果。又有很多同學本能的認為,模型在測試集上跑出來的準確率越高越牛逼。連過擬合這種問題都忘了。結果在面試的時候被面試官懟穿,這都是很常見的哈。說話謹慎不是問題,被懟穿了才是。
- 注意:工作中真正操作的時候,要因地制宜選方法。
-
- 注意:一提到預測,大家腦子里會自然蹦出來很多很多統計學/機器學習的算法。具體的操作展開寫內容太多,這里僅幫大家梳理下邏輯。細節可以后邊慢慢更,或者大家自去看相關統計學/機器學習文章。
5.屬于“怎么做”的方法
- 定義:指綜合判斷狀況,下分析結論,輸出建議要實到個可執行的抓手上。
- 方法:同時考慮到資源與需求,幫助找到實現目標的最佳方式。(所以,“又如何”是分析最后一步,因為往往做判斷,需要做一大堆前期工作。需要搞掂了數據、搞掂了標準、了解清楚原因,做了預測以后,才知道怎么下結論。)
- 判斷標準很清晰,判斷的指標很少,那下結論是很快速的,不需要復雜的分析。比如:女生說我就是不喜歡禿頭的男生,那就看照片一票否決,來的非常爽快。這里不需要分析。
- 在復雜判斷中,有主觀法和客觀法兩種。牽扯指標很多,指標形態很復雜的時候,就很難決定了。比如:小姐姐說我想要一個男的對我好(行為指標)有上進心(心理指標)有發展潛力(預測值)真心愛我(戀愛原因),這要求一出,就是個非常復雜的判斷。
- 主觀法:就是基于人工判斷(專家判斷),只不過打分方式有很多種,直接打分再賦權重的往往叫專家法,打一個矩陣評分再計算的叫層次分析法(AHP)
- 客觀法可以通過因子分析(用方差解釋率做權重)神經網絡(算法訓練權重),這樣不依賴專家打工。
- 注意:實際工作中,做評估的最大敵人是沒標準,或者標準沒節操。看到銷量下降就試圖甩給沒有數據的外部因素,或者甩給目標定得太高,這樣的話分析就沒法做了。做評估第二大敵是所謂“業務識”,經常有業務部門跳出來“你做過業務嗎?老夫從業10年都沒見過這樣的”。做評估的第三大敵是領導意見,領導就是不想下這個結論,你咋辦?只能回來改ppt啊。所以你看,做評估的算法有很多,真正用起來少,還真不能怪我們沒本事。
總結
- 類型
| 直接解決 | 1.是多少 | 今天直播觀看10分鐘以上的人數是多少 | 不只是一個數,搭建數據指標體系也算“是多少” |
| 直接解決 | 2.是什么 | 今天觀看10n+人數70萬一一不滿意啊! | “是什么”的關鍵是評價標準!找標準也是工作之 |
| 直接解決 | 3.為什么 | 為啥90%的人都看不到10分鐘? | 找原因的方法很復雜,需要配合測試和長期觀察 |
| 直接解決 | 4.會怎樣 | 果我做了X工作,觀看人數會增加嗎? | 做預測的方法也多,很復雜,經常用到算法 |
| 直接解決 | 5.怎么做 | 上個抽獎,人數增加了,可其他指標降了呀! | 高大上的叫法叫:綜合評價問題,常涉及復雜評估 |
| 間接解決 | 6. 想不想 | 我要不要去簽約幾個美女主播回來? | 轉化為4:列出支持想法的理由,用數據驗證/否定 |
| 間接解決 | 7. 能不能 | 我讓美女主播露臼花花的大腿,會被查封不? | 轉化為5:(黑箱)數據測試(白箱)收集過往結果 |
| 間接解決 | 8.會不會 | 我到底該怎么做,才能合理合法的讓 | 轉化為4:從問題出發找原因/從手段出發找可行性 |
| 間接解決 | 9.該不該 | 我還是決定簽美女,該不該現在干! | 轉化為5:(事后)評估效果(算)除證浮綠 |
思維導圖如下:
三.數據分析思路如何建立
1 類是用數據描述問題,把問題量化。2345類都需要探索-假設-檢驗-總結的循環性的過程對常用方法的簡單總結。解決后面的問題,通常要先解決前面的。
分析的思路建立
-
理想情況:
設定數據指標→數據監控過程→數據預警問題→分析問題→探索對策→進行測試→驗證假設→總結經驗→更新指標體系循環監控。“大廠經驗”,其實只是這套流程運轉的比較順利而已。 -
注意:
- 分析思路跟具體工具關系并不大
沒有數據的年代,還有定性分析方法;有數據的年代,還有基于調查問卷數據的調查分析,有基于交易數據的經營分析,有基于用戶APP/網站行為的“大”數據分析。數據來源越豐富,數據越準確,可用的分析方法越多,結果也越精確,但基本思路是一樣的。 - 核心:業務實踐和科學思維
“生搬硬套終成空;棋無定式方入門”。要基于業務靈活的變通,一切以范圍內解決問題為核心。無論是數據產品賦能、數據賦能基本,形式不同,核心不變。
- 分析思路跟具體工具關系并不大
-
思維方法:臨床診斷疾病
- 調查研究,收集資料;
手段:問診、病歷、體格檢查、特殊化驗與檢查.
要求:真實性、系統性、完整性。 - 分析、評價、整理資料;
結合癥狀、體征、檢查結果、理論知識、臨床經驗 - 提出初步診斷;
為進一步診斷的前提或試驗性治療的方向 - 確立及修正診斷;
結合初步治療,進一步檢查/診斷性治療 - 最后確診,進行治療
-
基本流程:
- 觀察現象
(冷、發抖、打噴嚏)——(市場口碑、業務反饋、指標變化) - 結合原理
(感冒的癥狀)——(業務邏輯+分析邏輯) - 做出推論
(感冒了)——(建立假設) - 采取行動
(吃藥/扛過去)——(基于假設,采取業務動作) - 驗證假設(
吃藥3天/扛了3天)——(檢驗結果,積累經驗) - 進一步分析
(癥狀消失/癥狀加劇)——(持續監控) - 進一步行動
(不理它/看醫生)——(持續監控)
1. 理解業務——工作的前提
理解業務是需求分析的前提。
不理解業務不但無法賦能別人,而是自己需要別人賦能。看不到業務,看不懂業務,不知道業務進展、無法溝通,自然沒法把分析邏輯和業務結果聯系起來。需要深入一線了解:服務對象、業務流、管理流、數據流、業務現狀等。業務的理解程度決定了后續:對需求的理解,分析方法的準確性、能采取的措施建議。
服務對象:誰是我的賦能對象。
剛入行的菜鳥們喜歡籠統的說:業務。滿腦子都是“copy模板、模型、公式”。業務并不是一個孤零零的、獨立的個人。業務兩個字背后,是非常具體的、復雜的維度:
各維度影響
| 行業 | toC | toB | toVC |
| 部門 | 銷售 | 運營 | 產品 |
| 等級 | 部門總監 | 部門經理 | 小兵 |
| 動機 | 尋求求助 | 證明自己 | 甩鍋 |
| 行業+企業 | 數據基礎 | 戰場 :數據的基礎建設、對數據的認知程度、發展方向 |
| 企業+部門 | 工作職 | 戰略:工作定位、流程、人員、相關措施、制度、活動,有哪些歷史遺留問題,過往經驗 |
| 部門+等級 | 關注重點 | 戰術: 職責KPI/OKR、當前指標表現是什么,哪些分析指標反映了他的問題,有多嚴重 |
| 等級+動機 | 具體要求 | 戰斗:他希望從數據分析里得到什么結論,數據分析實際上可以幫他解決什么問題,ˇ還有哪些是可以幫上整約 |
| 戰略層 | 做哪個方向 | 我們要抓DAU指標?觀看人數?觀看次數?這個指標目標多少,要提高多少? |
| 戰術層 | 已經選擇了方向,縣體做什么事情 | 我們決定了要抓觀看時長,盡量讓用戶觀看10分鐘以上。那么問題是:我要找更優質的用戶呢?還是改進直播體驗呢?還是找一些大牛主播呢? |
| 戰斗層 | 已經決定了做什么事,事情做的大小、多少 | 我們決定了簽約主播,那么市面上有哪些主播可以簽,簽哪些游戲的主播?簽來要播多少次,要不要搞個對抗賽讓主播LoW一把,啥時搞氣學 |
等級影響
- 越是上層的領導,越會關心數據,但是他們只關心結果。需要總覽全局的工具,看到結果、定位問題,調配資源。例如:BI+儀表盤
- 越是基層,數據越沒用,他們關心的是執行。需要簡單、直接、可復制的武器,直接套用在流程中。例如:哪類客戶是目標?優先順序如何?賣點依次是什么?從話術到優惠如何促成交易?交易后如何維護?
部門影響
| 銷售部 | 直接對業績負責,出業績! | 快速找到方法,然后各個業務線,各個團隊復制、復制、復制,執行力最重要 | 這個月業績有多少,我能不能借力活動作出業績,如果能,還有沒有人沒借上東風,我怎么幫沒借上東風的人借 |
| 市場部 | 打輔助,提供活動作為工具 | 需要較長時間籌備(方案、系統、物料、宣傳)策略性很重要,策略不對,努力白費 | 活動有沒有效?活動有沒有效,如果有效,下個月還做不做,如果沒效,加碼還來得及不? |
| 供應鏈 | 做支撐,保障產品供應,維持庫存平衡 | 籌備周期非常長(備貨、周轉、生產排版)且開弓沒有回頭箭,(生產線一旦啟動就不能停需要打提前量 | 預計銷量如何,現有庫存能維持多久,是否要增加供應 |
動機影響
| 策略類 | 戰略發展、產品管理、用戶運營 | 夢想轉為計劃 | 部署和節奏 | 2 | 3 | 1 |
| 創類 | 研發、設計、產品經理、品牌創意 | 創造價值 | 創造力 | 3 | 2 | 2 |
| 執行類 | 銷售、市場推廣、媒體、社群、運營 | 只談干貨、錢 | 干!干!干! | 1 | 1 | 3 |
| 支類性 | 客服、售后、生產、供應、物流 | 支撐前線 | 干 | 1 | 2 | 3 |
業務流程:
-
數據基本情況:擁有哪些數據,來自哪里,
對象在做什么?分為幾步做?得什么結果?數據流是什么?可以采取流程法思考,落實到數據。流程法:業務層上各業務是并行的,流程層上是有先后順序的
第一步,先梳理流程,
第二步,確定每個步驟當中涉及到的一些業務點,
第三步,根據每一個業務點去梳理量化其中的一些數據。
案例:如何控制商品庫存積壓成本?商品生命周期業務流程需求數據需求 上架準備 商品定位、評級 商品定位是否科學,品級是否合理 成本、庫存 預熱 宣傳預售 通過預售反饋,預測第一批銷里,驗證品級合理性 預算、庫存、廣告費用 上市 走量、補貨 根據銷售變化,預測未來銷量判斷LTV 銷量、利潤 熱銷 促銷、變現 根據銷售變化,預測未來銷量,預警庫存 斷貨率、流失率、轉化率 穩定 控制庫存 庫存管理,活動預測 銷量、周轉率 清倉下架 尾貨處理 需要多久清完庫存 周轉、毛利
- 核心指標,指標的計算方式。數據指標是業務的核心、業務的抓手,能夠駕馭指標才能解決業務問題。
- 業務反饋、指標變化。做了多少? 達到結果沒有?卡在哪一步?理想情況:能用指標體系清晰量化情況,能基于數據診斷問題。需要有良好的數據采集、數倉建設、數據治理基礎等較為完善的機制。
業務痛點:
哪些地方是不滿意的,想改善哪些問題。
**決定發力時機的選擇。**數據分析項目,最大的敵人是:日常工作。所以,并不是所有事情都適合立項目來做。時機非常重要。往往我們要挑業務部門的以下時機入手:想做創新、想改良現狀、新工作兩眼一抹黑、遭遇問題不知所措、三板斧砍完不見效
套路經驗
想找方案,就要先研究套路。大量數據分析一聽“如何做”就怕了,因為我們不做具體業務,站在數據分析角度,關注的不是某個具體idea,而是哪個套路更管用結合數據,找到更好的套路,才是數據分析的作用。這里需要數據分析師對常用的業務套路所有了解。
業務需求
有業務需求時,先不要著急跑數,牢記靈魂三問:
- 這是個啥層級問題?
服務對象決定 - 這是個啥類型的問題
數據分析可以直接解決的問題有五大類,可以間接解決的問題有三大類 - 當前狀態下要輸出什么成果
| 臨時取數 | 戰斗層 | “這個數據老板要,下班以前要搞定 | 看似投入少,需求一多,非常時耗力 | 幾乎沒有,不會有人注意你 |
| 報表 | 戰略層、戰斗層 | 跟蹤固定指標,發現問題 | 建指標體系耗時,后續維護簡單 | 長期內大家都會看,但幾乎沒有人說你好 |
| 專題分析 | 戰略層、戰術層 | 針對專項問題,尋找辦法 | 無論啥時候都費時費力 | 短期內有效 |
| 數據模型 | 戰術層、戰斗層 | 適合模型解決的特定問題 | 非常吃數據質量,想實現效果需要業務的配合 | 不是露臉,就是露屁股 |
| ABtest | 戰斗層 | 有具體業務方案情況下做測試 | 需要大量前期準備,有可能需準備很多個版本,開發壓力大 | 工作量大,短期內有效,同意產生依賴 |
| 數據產品 | 戰略層、戰術層 | 有經費/人力/時間的話盡量都做成產品,直觀,好用 | 非常多經費/人力時間投入 | 需要培養用戶習慣 |
- 例如:
套在電視劇里,如果你是總指揮,意大利炮簡單,為啥我想不到?因為你既不是李團長,也不是二營長,也不是山本大佐。你的位置和電視劇里的總指揮一樣:前線都打成一鍋粥了,你還不知道發生了什么。哪里在打,誰在打,打啥,打的咋樣了,完全不知道。如果有了以下信息會很快明了
對象:李云龍這個混小子
級別:戰術+戰斗
現狀:優勢兵力,四面包圍,打縣城!三個方向已得手,唯一卡在城樓,攻不進去
經驗:圍點打援
痛點:城樓太高,敵人火力太猛,步兵沖不上去
需求:需要時間、重火力
2.需求分析 —— 分析的前提
病人一般的小病是不需要醫生的,同理,當需要分析輔助時一定是業務遇到無法理清的大問題。數據分析師要像醫生對待真實的病人3一樣。菜鳥確認需求完全依賴于:問業務、套模板;老鳥確認需求:具體情況具體分析帶著經驗、方案、邏輯……一步步引導業務到數據分析可以解決的問題上。
項目意識
需要復雜的問題該立項做盡量立項做,不能立項做的也要有項目思維:項目目標、工作范圍、輸出產物、交付時間。有多大鍋下多少米,如果數據質量差、人手不足、缺乏基礎,缺乏經驗、就沉住氣一步步做,不指望一次解決所有問題。
- 項目管理鐵三角
投入和產出是每份工作都要明確的。鐵三角需要確認的質量、時間、成本。- 產出質量:
包括:1.看清形式(數據、報告)2.找到問題(分析結論)3.對形式判斷(分析結論)4.執行名單(分析結論/預測結果)。
數字、模型、報告本身不是產出。業務從不了解情況到了解,從沒有辦法到有辦法,從不知道怎么選到知道怎么選,從沒有準備到一二三級預案,這才是產出。所以不要脫離問題就數論數。從數字里推出結論。 - 時間:最遲什么時候要結果
時間千萬別忘了。時間緊,盡量快速出結論;時間寬,就要分步驟輸出,企業不是學校留大半年給你慢慢憋論文 - 成本:
數據分析師的人手、加班時間、數據質量、業務配合度(缺一不可)
- 產出質量:
- 沉淀與可復制
要想辦法沉淀些能復用的東西 ,面對同類分析需求每次都一個個從頭研究,估計得忙到黃花菜都涼了,而且可以作為項目輸出的一部分。例如:對主要的分析對象建立評估指標體系,沉淀一套評估方法論和監控指標,甚至有希望上一個小數據產品來做長期監控 - 可執行
解決怎么做,給出的建議要可執行。可以套用:5W2H。- where-在哪里搞
- who- 誰來搞
- what-搞誰?
- why-目標
目標模糊時需要得出大致的范圍,結合趨勢+目標進行計算.有個這個測算,我們就對宏觀形勢有了判斷,可以爭取資源,鎖定工作范圍.注意測算時模型盡量簡潔:越簡單越容易讓不同知識背景的領導們達成共識。 - when-多久
目標要結合時間、措施、投入:投入是多少、每個階段做什么、大致目標是多少 - how-方案結合數據,找到更好的套路,
- how much-投入
| 多 | 精致工程:合理規劃+按部就班+細致工作+及時回饋 | 突擊工程:金錢換時間、人多力量大、實用第一 |
| 少 | 雞肋工程:有空就搞搞 | 應急工程:抓冬瓜丟芝麻
問題題眼
題眼是指對解決最重要的影響因素,只有一個,由實際情況決定。一般來說,用戶出現問題時:直接面向用戶的商品是關鍵因素,為什么是這個商品不是別的,為什么觀察這個角度的數據?
需要進行復雜分析的往往是要解決5個問題中的后兩問,需要先解決前面的問題,是多少,是什么,為什么
構建分析框架
業務冋題不直接等于數據問題,要做把業務問題轉化為數據邏輯:明確分析思路,數據需求。判斷問題的真偽、大小,問題的背后可能有,商品、產品、用戶群、競爭對手等各反面的問題,要從根據業務邏輯/分析邏輯建立一個問題邏輯樹,用于系統診斷:出問題的位置。
- 邏輯樹能全面、有序的展示思路,樹的每一個分支最后要盡量落到數據可以支持的地方。
- 轉化問題
可以用兩個方式轉化問題:
第一,從需求出發,推導可行解決范圍,落實到一個具體問題上。例如:需要上促銷。需要什么形式是否存在沒促銷也能做起來的標桿?復制了沒有?形式、力度是否可優化?
第二,從痛點出發,先找到需求背后的真實痛點,再找解決痛點的方案。例如:需要要上促銷!上促銷為解決什么問題?解決邀約客戶難的問題?有沒促銷也能約的標桿?人家是怎么做的?是否可以復制?做那些事解決邀約?列出潛在方案,再分析經驗/測試
構建分析假設,
問題邏輯樹展示的問題較為瑣碎,一個個研究不現實,要根據問題的主語進行歸納設計假設
案例:用戶是否喜歡平臺、用戶是否喜歡直播、用戶是否喜歡游戲,可以合并為用戶質量問題,同理歸納為產品質量、服務質量等有限的幾大核心。針對幾大核心提出假設:1. 用戶問題:用戶本身質量不高,投放不準 2. 推廣流程問題:推廣環節多(比如先拉群,聽直播再推付費課),效率低 ……
尋找數據,驗證假設推導出核心問題
這是數據分析師最能發揮作用的地方,因為能客觀看待問題,避免本位主義,需要:
- 具體問題具體分析
- 指標/評估體系
對核心對象建立指標體系 或者根據評估體系,匹配對應的問題
解決問題的層級
業務部門解決問題有一個從無到有的過程,數據分析輔助要根據業務部門的基礎有層級順序的分層級輸出。因此得先看業務部門到哪一步卡住了,不做跳躍層級的事,沉住氣一步步來,最后結果才容易得到認可才好發力:
無法量化就先做數據報表,此時要判斷數據是否已采集,在采集完成后,梳理指標輸出數據,把基礎情況搞清楚完報表可以匯報了,再向下一階段推
判斷標準一定要事先立!太多項目死于“提高銷量”“增加活躍度”這種含糊的標準到底提高多少!增加多少,事前要有斷。
分析假設,可以按圖索驥排查原因。沒有假設或者假設不足,則需要先按照業務流程排查清楚原因。
有預案可以執行預案。沒有預案,考慮是否有可參照的預案,有則匹配參照對象與問題;沒有參照,帶著問題、邏輯、條件尋找方案。
沒有信心則進行:ABtest或者預測方案。有信心則建立過程監控報表,上線預案。
控制好業務方期望
除了期待之外,一切都有邊界。現實中每個人都受崗位、部門、等級的限制,資源有限,因此可用的手段往往是有限的。這樣是個利好:我們篩選方法的范圍不是無限廣,而是在有限的選項內做選擇。業務們的痛點,很多不是數據能解決的。問題分析完之后,要及時與業務方溝通預期結果,要注意留有邊界,以防項目死于期待太高
- 注意
-
不要依賴業務
確認需求,不是讓你直接問業務:“你們想分析點啥”。這種問法太被動,又回到叼飛盤老路上。而且往往業務會回答的你摸不著腦袋: - 真實場景中需要我們處理的正是業務無法清晰講明的問需要分析定位:具體怎么難做法?具體表現是什么?具體在哪里?而業務部門自己是那個在雨里狂奔的人,啥時候淋濕的,淋濕了啥感覺,他們比數據分析師更早感受的到。就像得了感冒很多人選擇自己扛過去一樣,很多業務部門也喜歡選擇:自己扛過去。所以最后到數據分析師這里的問題,往往是“誒呦,痛痛痛,我也說不清楚”——因為說得清楚的早自己處理了
- 業務方直接提出來的需求,很有可能是個偽需求,或者效率的需求。
大部分業務一遇到問題,最直接想到的就是找公司要資源,特別是打折;我們需要考慮:為啥別人家不打折也能賣?為啥促銷參與率那么低?為啥新品流通比平均慢20%?為啥二次跟進次數少一半
-
-
不死硬套模板
實際問題是復雜場景,不是大喊一句“我是互聯網AARRR思維”就能搞掂的。指望套模板結局就是死翹翹。況且經過這幾年的歷練,很多運營、產品經理、策劃都學會了基礎數據分析概念,這時候還抱著充滿“SOWT、PEST、5w2h”一類空洞口號ppt模板,數據分析師就等著下崗吧。具體問題、具體分析,怎么強調都不為過。
例如:曾是toC互聯網企業,現在要發力toB,完全不知道怎么和客戶打交道;名為互聯網產品,可服務對象是實體老板,銷售還在用最原始的電話外呼;
3.開展分析工作——核心工作
基本思路理清楚、定好交付時間、排工作優先級、安排項目組成員。然后就可以按計劃下地干活。具體內容和分析議題有關,這里無法展開講的。當有工作方式需要注意:
- 分析和決策脫離:這是最大、最大、最大的問題。往往做決策是拍腦袋、憑經驗、抄對手、聽安排,缺少真正的分析,作分析的實際上僅僅在更新數據,沒有意見,沒有解讀,沒有洞察。
- 理論與實際脫離:這是第三大問題,講起AARRR如數家珍,可具體到一個行業,一個業務,一個活動,一次文案,到底數據形態是啥樣,到底該做到多少合適,完全沒有頭緒。
- 缺少歷史經驗積累:對過往數據沒有采集,沒有積累,甚至很多做數據的同學連業務目前在干什么都不知道,更別提以前干過的,這能分析就見鬼了。
- 缺少活動、策劃案、文案標簽體系:就如同沒有打用戶標簽很難理解用戶一樣,沒有打這些業務標簽,也沒法具體分類對比業務,更沒法總結套路。
- 不要一開始就陷入到細節當中,要抓住分析的重點
- 及時溝通和分步落地
- 完成一個議題溝通一次,切記憋大招。
憋得越久,人們對你期望值就越高,最后失望就越嚴重。因此,只要項目工資超過1周,就得有周匯報,通知大家進度;時間超過1個月,一定要有月總結,拿中間過程和大家碰一下。特別特別是用到算法的項目,死于業務期望值過高的例子,特別特別多。過程中,具體的算法過程不用向業務匯報,但是遭遇的困難和期望輸出的結論,要經常保持溝通,適當控制業務期望,避免最后一刻才發現貨不對板,最后身敗名裂。 - 分布落地
有部分共識以后,直接往戰斗級推進,有部分亮點出來,及時上更細節的分析/策略研討最好看到一個數據改善以后,再推下一個。 - 監控數據變化,如果大形勢變化,適時調整方向。
- 及早給出預判
在項目開始前,預先給出結果判斷非常重要。有可能假設問題里,有些運營已有明確結論,有些運營不想改/不能改/不會改,有些運營毫不在乎。提前溝通能直接繞開這些溝溝坎坎,極大的減少分析完以后被人質疑:“你說的有什么用!”“你說的很好,可這毫無意義”“你說完了我還是不知道怎么干”的問題。保持溝通,在后續項目推進中同樣重要 - 具體問題具體分析
回到服務對象的角度,單一的賣點很難支持所有人的需求,需要針對部門、崗位、特殊需求進行包裝 - 篩選結果輸出方式
要求只有一個:有效 - 方式分類:工具、知識、資源、服務。方法的來源除了創新之外優先參考過往經驗和行業經驗。
- 適合:考慮業務部門的數據化層次,不做跳躍層級的事,沉住氣一步步來。
- 實用:選擇更有效的方法,所有面對一線的東西,對便利性的要求,都是遠遠大于科學性的。例如:對于銷售而言,簡潔的數據標簽比圖更有用:
4.落地方法——最重要環節
對實際價值而言,只有分析思路和方法是沒有用的,更重要的環節是:落地。落地方法這一步,得看具體的方法是什么,再具體執行,這里大部分是具體的業務操作,和數據關系不大。但在具體落地的時候會遇到:上同下反4的現象。問題的本質是沒有對數據的作用溝通到位:數據不是祖傳的救命仙丹,它不能一吃就靈。
循序漸進,威逼利誘。
數據分析的結果不一定就正確,類似于臨床的初診,治療性診斷、需要迭代才能確保有效。而且對銷售業績而言,促銷才是救命仙丹,一降價肯定有銷量,但救命仙丹其實都是汞、硝、硫磺這種劇毒玩意,嗑多了人就掛了。這也是數據產品真正難題,避免問題拖到了需要嗑仙丹的地步。
- 首先,有一個良好的開始,醫生不會說馬上就有效的話,先開幾天的藥,叮囑你按時吃藥。我們可以先找到那些對數據最信任,最喜歡的用人做第一波種子。
- 其次,重視反饋。醫生會會告訴你大概的有效,看清況:如果無效加重劑量或者換藥,有效的話提醒你好轉的情況。如何能得到反饋,要根據對象來靈活變通。
- 接著,從眾效應,給你舉例其他患者的案例,鼓勵你。有了使用率起來,就可以開始搞從眾效應,
- 最后,威脅恫嚇,在有效的情況下,如果業務放棄治療會有哪些的可怕后果。
落地目標結合業務動作
方法要能落地,這是首要。數據分析驅動業務是正確的廢話,太空、太虛。想要讓數據分析成果在一個部門里落地生根,要從’太理論‘到實用:
我能做個模型→我要找到運力最缺乏的時間
我能做個報表→我要找出來效率最低的班組
我能做個ppt→我要識別最容易投訴的客戶
例如:比如,數據和物流部合作,物流部的目標也會隨著公司大目標變化,所以比起丟一個大而全的報表,不如每次聚焦一個小目標,小步快跑 :
監控進度,接受反饋
方案實施 作為數據分析,能做的是:監控進度,保障按計劃執行,個冋題有一個具體針對性意見。每個意見,先看有多少人使用,再看接受后指標改善。
在執行掉鏈子的時候提示問題。比如:
- 工具:上意大利炮(從哪里,用什么型號炮,調動多少,調到哪里)
- 資源:多調兵支援(從哪里掉,調誰,調多少,調取哪里)
數據產出必須固定成產品/服務,堅決不能讓它躺在ppt或者excel里
區分對待服務對象
找到好隊友。數據產品知識只是一個開始,就像醫生開的藥,效果往往是緩慢的提升,甚至需要治療式診斷而且沒有人的配合很難獨立產生價值,大部分企業的數據分析部門,沒有獨立經費和工作團隊,需要通過服務業務部門實現分析成功的落地。這就要求我們,有良好的溝通能力及敏銳的識人眼:
| 好 | 新兵銳將 | 蝦兵蟹將 |
| 差 | 驕兵悍將 | 疲兵倦將 |
- 驕兵悍將:保護自己是第一位的,不要頂撞他們,更要避免淪為他們的甩鍋對象。先安分守己,避免出錯,再談其他的。
- 新兵銳將:這是最優先考慮合作的團隊,一旦發現,盡早聊,盡早開工!
- 疲兵倦將:這些人問題非常突出,且喜歡甩鍋,所以除非已經有了有把握的方案,否則不要招惹他們,避免麻煩上身。
- 蝦兵蟹將:這些人容易談合作,但出成績難,可以挑其中尚有生機的“活蝦”合作,嘗試著做一些
小成績,再爭取更大的機會
-
注意影響落地的因素:
- 決策與執行脫離:這是第二大的問題。往往方向、費用、策略,是上層領導決定的,基層同學們每天忙著:做方案-請示-改方案-請示-改方案-請示。對于為什么這么干,干到哪里才算完全暈頭暈腦。啥分析都沒用。
5.復盤經驗
數據賦能、數據產品……說的好聽,最后賦成了沒有,賦成啥樣,要拿數據說話做檢驗。不用說,這又是數據分析老本行工作。
-
匯報工作
匯報的時候,除了項目流程也要考慮目標聽眾的身份、目的、結合項目目標做個性化匯報。這樣才能取得好效果。基于聽眾的思考,使得即使同樣的數據,同樣的結論,也能有不同的表達形式,最后抓住聽眾眼球,菜鳥數據分析師眼中老鳥數據分析師眼中 分析背景 誰在聽? 分析目的 他關心什么? 指標含義 數據怎么能幫助他? 數據來源 什么表達他能聽明白 數據清洗 建模過程 分析結論 業務建議
案例:
問題:某短視頻平臺,游戲直播業務的日活用戶1000萬左右,但90%觀看時間不足10分鐘,運營希望盡可能多的讓用戶觀看10分鐘以上,請分析下該干哪些事情。
遇到這種運營很頭疼的專項問題,這時候不立項,還等何時。先把旗子插起來,再開工
這是個典型的戰術級問題。已經定了要提高每日觀看10分鐘以上用戶數量,但是具體怎么做方向都沒有,這時候就得先搞清方向。
這個問題是個典型的“怎么做”問題,運營要的是具體執行建議,因此就不能光在數據層面纏繞,得結合運營可以干的事情來思考。
結合本次目標,最好先輸出一個專題報告,大家達成共識以后往戰斗層去推進,才容易落地
問題的題眼有:短視頻、游戲直播、DAU、觀看時長。短視頻平臺不稀罕,直播也不稀罕,DAU也不重要,觀看時長僅僅是結果(短視頻平臺的直播的游戲直播的用戶觀看時長)對解決最重要的影響因素是:游戲直播。'商品’種類有很多為什么是游戲直播?
- 游戲直播的特點”:
運營為什么會特別盯上游戲直播這塊,并且會發出“為啥連10分鐘都看不了的原因是什么?- 先天優勢:1. 游戲IP天生有粉絲,傳播成本低、 2. 游戲直播競技性、觀賞性好、3. 游戲打一局時間比較長,用戶粘性天生好
問題的主角是用戶,雖然表現是時間不夠長,當背后原因可能千頭萬緒,其實問題的核心,來自用戶、主播、產品三個方,使問題邏輯樹從用戶到觸達游戲直播展開:
問題的核心,來自用戶、主播、產品三個方面,可以歸納為四大問題:
1.用戶不行 2. 主播不行 3. 產品不行 4. 用戶和主播沒有匹配上
以上四個問題里三個可以用評估體系來完成。通過建立用戶需求、產品質量、主播質量的監控體系,來評估用戶、主播、產品到底質量如何,質量是否穩定
以用戶需求為例評估體系需要包括三個部分:第一、用戶、主播、產品的標簽;第二,基于標簽的分類;第三,基于分類的分層與數據監控,這樣可以把“用戶質量不夠好”這個判斷,落實成個具體、可量化的數據據結果:
上面僅僅是用戶的評估體系,還可以建立主播質量評估體系,產品質量評估體系。這樣做既能結束運營對基礎情況兩眼一抹黑的狀態,又能為匹配問題打好基礎,還能沉淀一套評估方法論和監控指標,甚至有希望上一個小數據產品來做長期監控。可謂一箭三雕。作為項目產出,遠遠比寫一堆PPT價值大的多。
定交付時間、排工作優先級、安排項目組成員,之后就正式開工了。
- 給預判
- 及時溝通
- 及時反饋
四.建立指標體系
-
定義:
指標體系 = 指標 +結構化 -
數據指標體系三大件
主指標、框架、標準 -
設計思維
自頂向下設計,再自下而上回歸。指標體系要服務于業務但,在具體的業務人員腦子里裝的是不是數據庫里的表結構,而是一個個具體的問題。他們眼中的是問題結構,這就是為什么要建立問題邏輯樹的原因。業務的每個核心的問題,可根據問題邏輯樹,分解為背后的小問題,而小問題有對應的標簽和數據,這就是指標體系。 -
流程
指標體系的建立需要對每一個業務單元進行:1.打標簽:用戶、主播、產品的標簽;2.標簽分類;3.基于分類的分層與數據監控4.評估迭代 -
意義
基于指標體系的診斷,只解決戰術問題:是什么、是多少。不解決戰斗層面:為什么,會怎樣,怎么做,未來怎么干得有更針對性的專題分析才行。 -
為什么需要數據指標?
- 標準=通過數據定義對象的好壞、類別
- 數據指標讓業務可預測、可評估。
企業的每一步都有成本,需要事先準備,事后評估。而環境是復雜的,數據指標就是對抗不確定,無法衡量,則無法提升,例如:推廣活動,具體的結果不到最后是不確定的,但我們需要提前為業務做準備:營銷費用、備貨量、倉儲量。活動結束后,衡量活動的效果:活動之后有多少新增?銷售額多少?用于積累經驗,減少誤差。
-
分析為什么需要數據指標體系?
-
指標體系是分析思路一部分
數據分析開工前,只有建立指標體系,后面再進行數據獲取、處理、分析、可視化的時候,才能有的放矢,才能按圖索驥.
-
可以對現象之間的相互聯系,做出有序且深入的分析。
一個指標往往可以分成好多維度,增加維度,能夠避免平均數陷阱。核心指標的波動往往是因為某一種維度的影響而產生的波動,所以我們要監控核心指標,本質上還是說要去監控這個影響維度上的核心指標。 -
工具性強
指標體系是針對核心對象建立的,有了指標體系但對象出現時能快速定位問題,展開分析而不是每次都重頭再來。 -
OLAP系統
Online analytical processing ,聯機分析處理,核心是一個OLAP多維數據集
一個問題,往往有很多方面。理清楚問題,就像吊車吊起一塊樓板,需要一組提手。只用一個指標不能充分說明問題,需要有一組邏輯的數據指標來細化。好的數據指標體系,能讓業務人員看一眼就知道該在哪里干,該往什么方向干,非常好用
1. 主指標(一級指標)
-
定義:
用來評價業務的最核心的指標。主指標是由問題級別決定的一個相對值,小問題的主指標是大問題的子指標。運營分工工作職責主要指標感性、理性數據作用備注 渠道運營 選擇渠道投放資源,拉新搞流量 投放數量、用戶轉化、銷售轉化、投放RoI 理性 中 講究策略性,需要觀察數據合理分配費用,改善轉化。具體則需要分渠道 用戶運營 通過獎勵、積分、會員等維護用戶新增、活躍、留存。 AARRR(新增、活躍、留存、轉化、轉介紹) 理性 高 特別講究策略性,AARRR各指標很難平衡 內容運營 內容創作用于內外部媒體投放:設計視頻、文案、廣告、供宣傳使用,通過微信、微博、公眾號、抖音、站內信等平臺影響用戶 內容全網點擊數、轉化數、漲粉數 感性 低 做內容特別依賴創作者的靈感和創意,數字只是結果 商品運營 銷售商品的進銷存管理 上架、進貨、銷量、庫存、利潤、周轉 理性 高 前期有感性的部分,后期都有周轉和銷量來定位 活動運營 組織活動,提升用戶、產品、商品指標 活動目標、參與人數、達標人數、活動ROI 高 高 數據為策略提供依據,但具體到每個活動力,影響因素很多:宣傳語、宣傳視頻、活動創意、代言明星等。 新媒體運營 兩微一抖等平臺日常運作 平臺粉絲數、內容點擊、轉發、轉化 中 中 產品運營 品體驗優化、升級、改版需求 產品路徑、用戶使用率、跳出停留的 中 中 -
建立
- 題眼
在具體分析中,面對具體的問題是可以建立共識之上的主指標,比如問題的題眼,各假設問題的題眼:用戶質量、主播質量、 - 直接選取 部門kpi
一般情況無需分析師創造,會選直接有利企業的指標,因此各業務部門都有自己的kpi。
- 題眼
-
主指標要素:
- 業務含義:在業務上它的意義是……
- 數據來源:哪個系統采集原始數據
- 統計時間:在XX時間內產生的該數據
- 計算公式:如果有比例、比率,得說清楚誰除誰;如果是匯總,得說清楚誰加誰。
-
注意:
- 存在多個主指標情況。
不是所有的子指標都能合成有意義的主指標例如:判斷活動整體的情況,除了銷售額,還要關注毛利,這才是真正賺到的錢。可能還得看銷售數量,因為銷售數量和庫存直接掛鉤,得防止積壓太多。這樣就至少有了三個主指標:銷售金額、銷售件數、銷售毛利。 - 注意虛榮指標
有些指標并非越大越好,比如僅僅關注用戶數,會忽視:虛假注冊/1人多號等問題
2.結構框架(二級/三級指標)
子指標是由分析框架決定,而構建分析框架的核心是:思考維度。自指標是對大方向進一步問題,使問題更加準確和具有可操作性。分層拆解要有強烈的邏輯關聯,,必須清楚了解他們是如何影響核心指標的,每一層的指標只能代表一個方向,不能有相關性,
-
好的思考維度:
分類維度本身無對錯,但有好用/不好用之分。不好用的分類雛度,數據切得很細,看完也沒啥想法;好用的分類維度,可以讓人一眼看到自己可以控制的地方有沒有問題。
例如:
-
核心是按照業務管理方式來拆解:
有很多維度都能當分類維度,選用哪些,完全看業務上能從什么角度管理問題。并非所有的分類的維度都有意義!每個部門能做的事情很有限,優先按他們可以做事情的維度進行拆分,這樣看完更容易指向:我該干x事情。
比如:銷售金額,既能以分公司為單位進行指標拆解,也能以用戶為單位進行。具體怎么看,要看業務能怎么管這件事。比如銷售一般按區域管理,那就按分公司拆。市場一般按用戶管,就按用戶拆。總之,基于業務最重要。- 越多越細越好
主指標往往是最終的結果,如果想更進一步管理,需要按照過程細化,無法細化則無法監督更無改進的。因此過程指標理論上越多越細越好,越多過程指標,可以越細的追蹤流程,發現問題。但沒有指向性的劃分,一次性加入太多分類維度會極大增加閱讀報表的負擔。看的頭暈腦脹也不知道干啥。 - 取決于:子指標的重要性+數據采集難度
在業務上,不見得每個動作都做了數據采集,因此要結合具體業務流程來,在關鍵節點加以控制。梳理過程指標,其詳細程度,取決于:過程的重要性+數據采集難度。線上電商、020業務,線上零售可以通過埋點記錄用戶行為,因此可以對銷售過程進行追蹤,從而建立過程指標;所謂的漏斗分析,其實是一個原理。傳統門店銷售很難釆集數據,且門店位置有區位壟斷效果,所以更關注訂單分析;B2B銷售,雖然過程很難采集數據,但銷售過程極其重要,投標中一步走錯可盤皆輸,丟掉巨大訂單,因此過程指標非常重要。
- 越多越細越好
-
常見的業務管理邏輯:
- 分類管理
分類的方式有很多:地區、線上/下、銷量區間、時間、用戶群……
案例:看到哪個業務線沒做好(如下圖)
- 按照計算公式的邏輯拆解
常見的:杜邦分析法
- 按照流程程拆解維度
比如:AAARR、漏斗圖、從用戶意向-談判-簽約-付費,哪個環節出了問題。
-
案例
像B2B業務,大里過程要線下銷售跟進,很難記錄,但即使如此,只要有有線索入庫時間,那至少可以算四個指標:
1.線索數(所有銷售起點,直接反應營銷推廣質量)
2.成單率(簽約/線索,直接反應銷售質量)
3.成單時間(從線索入庫到簽約時間,反應跟進效率,傳說中魔法數字)
4.成單數(就是常說的:業績數據,只是簽約已經是最后一步了)
3.判斷標準
找到了主指標,就得為它建立配套的判斷標準,這樣才能解讀數據含義。參照物的選擇,本身是個復雜的分析過程,需要做深入的分析。常見的有四類:
- KPI達成率法:
如果主指標是KPI指標,有明確的數量要求,則直接算達標率,達標了就好,超額完成越多越好通過對標年度/季度/月度目標,把一個靜態問題,轉化為動態數據問題,這樣就能通過前后數據增長趨勢對比,判斷是不是有問題 - 生命周期法
主要看環比數據,假設業務走勢會有一個明顯周期性,選一個標桿周期,比標桿好則算好 - 標桿法
以競品(寡頭)/行業為參照,超過越多越好 - 自然周期法
主要看同比數據,假設每年有一個正常走勢,則符合走勢,且比去年表現好的的算好 - 震旦曲線法
監控數據是自帶標準的可以粗略的使用。我們看一條曲線,即使沒有定義一個“目標值”,曲線本身的變動也能成為判斷標準。對于銷售額,利潤,用戶數這種正向指標(越多越好的指標),增長本身就是好的,增長的速度越快越好,絕對數越大越好。對于成本、風險損失、投訴這種負向指標而言,下降本身就是好的,下降速度越好越好,絕對數越小越好。
4.使用指標體系診斷問題
指標體系診斷方法:
5.建立指標常見問題
這是最常見的問題。很多同學的報表是從離職同事那里交接來的。為什么做?做了給誰看?看了又怎樣?一問三不知。反正每天照貓花虎,定時更新就好了。
有些同學試圖搞清楚,但是業務方自己是糊涂蛋。你問他:你們目標是什么啊?他答:提升GMV啊~~親,GMV這么宏觀的東西,他到底管哪一塊?提升的話從多少提升到多少?提升到多少算滿意?丫自己做方案也是照貓畫虎,稀里糊涂,更不要說和數據分析師講清楚了。
這個是另一個常見,且致命的問題。很多同學都是盲目更新報表,數據列了一大堆,到底什么算“好”什么算“不好”,不知道。或者只是天真的認為:漲就是好,跌就是不好。結果引出特別多笑話(如下圖)
這個問題往往是部門分工問題的后遺癥。
很多同學構建數據指標體系,喜歡堆砌數據。放一堆指標以顯得豐富。可實際上如果不按業務流程找子指標,指標之間邏輯性就很差,看起來經常莫名其妙。更不要說,很容易弄出來類似“你幸福嗎”這種稀奇古怪的玩意。
把用戶性別、年齡、地域、VIP等級、來源渠道、終端型號等等維度一通丟,顯得報表很豐富,實際上業務意義不清楚。你問他為什么拿男女分類,他答:分出來差異大……至于差異大了還能咋樣,業務上有沒有能力針對性別做事情,又不知道了。
五.數據報告
-
匯報動機分為類:
-
你問我答:有明確的問題要解答
弄回答是一個數字,還是一件事。這時候不是寫的報告沒人看,而是被人各種挑刺。-
即席查詢:回答即時的問題:是多少,是什么
-
多維分析:在多維度中鉆取,發現問題所在**,回答是什么**
-
預報:回答會怎樣,是最熱門的分析應用之一,預測型建模預測未來是多少
-
優化:回答怎么做,
-
-
我說你聽:匯報情況,需要從常規數據中解讀
做出來沒人看,就是那些最消耗體力,卻最不受待見的 -
標準報表:報告是多少。銷售/產品/運營日報、周報、月報、季報、半年報.它們一般是定期生成,用來回答在某個特定的領域發生了什么。從某種程度上來說它們是有用的,但無法用于制定長期決策。
-
警報:報告是什么。警報可以業務知道什么時候出了問題,并當問題再次出現時及時告知。警報可以通過電子郵件、RSS訂閱、評分卡或儀表盤上的紅色信號燈來展示。
-
統計分析:報告:為什么。在歷史數據中進行統計并總結規律。
-
報告分類
-
專題:單一性,深入性針對某一問題
采用:Word
-
綜合:全面,聯系性
采用:PPT
-
日常:進度性,規范性,日常性,時效性
采用:Excel
例如:日報
1.明確前提
報告幾乎是數據分析的最后一步,更多功夫是在報告之前要做好:
有基本的判斷、有一定程度了解,有深入功課
2.你問我答- 報告要點
初級報告
常常是領導或業務部門隨口要個數。這時候沒有分類維度,只是單一指標,因此只要區分清楚時間狀態,就能解答好。案例:
請大家看上圖,作答:
昨天的銷售業績是多少
是多少-單維度:一問一答,正面回答,簡單清晰。
答1:昨天的銷售業績是1000萬
明天的銷售業績是多少
會怎樣:就得講清楚:預測方法、預測依據、預測結果。
明天,是還沒有發生的,因此是個預測值。涉及預測,
答:根據上周規律來看,明天預計1200萬,比今天多20%。
今天的銷售業績是多少
3點前的是實際值,3點后的是預測值。所以回答的時候要區分狀態,答:截止下午3點,實際值是700萬,按趨勢推算,預計1400萬。
中級報告
案例:
作答:
是多少-多維度:判斷指標數、維度數、先總后分。
思考:這里有幾個指標?這里有幾個維度?第一問有幾個問題?
- 這里只有一個指標:業績,
- 但是有3個分類維度:周、日、產品。很多新人會脫口而出:兩個分類維度,時間和產品。請注意,時間是又分成周和日的,因為這個指標很明顯有周循環趨勢,因此周這個維度是不能省略的。
- 這里顯然不止一個問題。因為有了分類維度,所以有了整體和部分的區別。我們不能像初級匯報時候那樣丟一個“總業績是XXX”交差。遇到整體和部分,大家記得這個順序:整體-局部-個案的順序。是基于時間維度的總分結構,產品可以類似做分解,整體情況說完,各個分類維度一個個過可以這么說:
為什么:結果明確,量化因素,展示假設
注意,問的是原因。原因指的是一個具體影響業績的問題,不是數字本身。分析出原因需要具體分析方法,這里略過,但作為報告,不管中間方法有多少:
高級報告
在數據分析領域,沒有高級的方法,只有高難度的問題。問題本身含糊不清,就一下把報告的難度從初級提到高級了。和中級報告的最大區別是:中級報告是基于數據談問題,而以高級報連基礎的事實、數據都沒有。這種情況下要牢記:先問是不是,再問為什么。
- 為什么這個月業績很差?
先回答:是多少,是什么。擺事實,再樹標準,最后再分析。
回答:1.這個月業績數值是XXX2. 判斷好和差的標準是(上月、去年同月、KPI指標……)3. 和標準對比,差的程度是(不存在,輕,中,重)4.如果問題不存在,干脆就不答了5.最后回答:這個(輕,中,重)級別的差,是因為……
我們的產品體驗有什么問題?
先回答:1. 用戶體驗的考核指標是XXX. 判斷好和差的標準是(上月、去年同月、KPI指標……)3. 和標準對比,差的程度是(不存在,輕,中,重)4.如果問題不存在,干脆就不答了5.最后回答:這個(輕,中,重)級別的差,是因為……
為什么我的領導會聽到顧客不滿意的抱怨
套路也是一樣的。只不過問題3更不靠譜要先落實情況,要先明確對象、問題、事實、數據指標,再樹標準,再分析再后續分析:
1.我的領導是誰2. 我的領導在什么時間、地點、以什么方式3. 聽到了哪一個用戶,關于什么問題的抱怨
3.我說你聽,報告要點
說大家關心的話,減少毫無意義的BB
分析工作中殘酷的真相是:數據是很重要,很多人是需要每天看數據,但數據只是他們工作的一小部分。因此大部分時候,看就看了,也不會特別當成一回事。主動匯報,想讓人聽進去,得抓
四個場景。
所有報表,都有第一次見人的時候。雖然以后這張報表會出現很多次,但在今天以前,沒有人看過這玩意。所以你得把基本概況解釋清楚。這里有一個指標(業績),三個維度(周、日、產品類型)。因此講概況,要按從整體到局部,一個維度一個維度說。開局的時候,啰嗦一點是不怕的,因為大家一無所知,如果說的太少,反而讓人覺得摸不著頭腦。
平安無事,也是一件要報告的事。因為好與壞是相對的,能清晰的標識出哪些是好事,就能找出哪些是壞事。樹立清晰的標桿,對于判斷形勢非常有用。就簡單寫:12日當日業績500,無異常。就好了
出了問題大家都知道匯報,問題是:怎么知道出問題呢?如下圖所示,事后我們都知道本周出問題了,但是到底在哪個點該出來喊,該怎么喊?可以提示的點好多,越是緊張的時候,越需要數據做支持,這時候是不嫌多的。大部分常規報表就像體溫計:能提示問題但不能解決問題。所以發現問題,不要局限在一張excel表里,主動擴大工作:及時給建議,提早給提示是很重要的。案例:
- 從部門職責、工作方式、人員級別、敲定核心關注點
做總結性報告總結性匯報,誰負責,誰關心因此沒必要所有總結都長篇大論。 - 先定基調
比如我們是想表達“做的很好”,還是“有問題”。大基調定下來,后邊細節就好定了。 - 提前溝通
總結性匯報最容易出車禍因為很多數據分析師并不知道業務方的判斷標準,同一件事可能數據認為是好的,但其實業務方很不滿意!所以一定要在平時有充分溝通,不然貿然下筆,很有可能被人噴
對癥下藥的報告方式
-
To銷售部
首先要清晰:銷售部關心的是業績,活動什么的只是業績一小部分。- 大標題應該是《4月份業績情況匯報》,第一頁講的應該是4月份業績實際/預計情況(如下圖):
- 其次,關注到業績細節,為領導們排兵布陣提供依據,展示各個業務線的差距,至于原因需要進一步溝通和分析:
- 最后,如果面對下屬,可以肯定A\B線的成績,鼓勵他們繼續行動。D\E線的人肯定有苦水想吐,可以借報告的機會,讓他們和AB交流下,看看有什么問題,這樣也留下后續深入分析的線索
- 大標題應該是《4月份業績情況匯報》,第一頁講的應該是4月份業績實際/預計情況(如下圖):
-
To市場部
首先要清晰:市場部關心的是活動,業績什么的只是活動帶來的結果。所以匯報給市場部,-
大標題應該是《4月份活動情況匯報》,第一頁講的應該是有活動和無活動的差異。注意,這就涉及到無活動的業績該是多少,或者叫自然增長率的問題,聚焦點不同于銷售的是需要展示活動新增帶來的業績:
-
其次,關注到活動細節,為領導們的以下決策提供依據:1. 本月是否加碼2. 下個月是否還做。分維度對活動效果進行評價,一般來說一刀切的效果不一定能拉動全線,后續是否需差異化都需要核實
-
最后,如果面對下屬,可以先肯定活動成績,讓他們知道你是站在他們這邊的,之后再借這個機
會,聊一下后續打算,知道他們下一步計劃,從而為深入分析留下
-
-
To供應鏈
首先,供應鏈關心的不是業績本身,而是業績對庫存/生產的影響,所以同樣的業績數據,給供應鏈看,可能就是完全不同的樣子- 大標題應該是《4月份周轉情況》,特別是2、3月已經嚴重積壓的情況下。雖然看起來4月有好轉,但是這個好轉是否能清理掉庫存,
- 其次,關注到庫存細節:活動期間的斷碼率;加壓產品的維度分析;庫容、產能是否會引發新的缺貨;等
- 最后是下一階段銷量計劃對應的庫容建議。
- 大標題應該是《4月份周轉情況》,特別是2、3月已經嚴重積壓的情況下。雖然看起來4月有好轉,但是這個好轉是否能清理掉庫存,
4.失敗的報告
案例:沒用的報告
1. 男女比例4:6
2. 30歲以上占比40%
3. 平均年消費500元
4. 活躍1個月以上用戶55%
- 報告沒價值的核心原因
- 無判斷標準,
男女比例是不是個關鍵問題?4:6是不是有問題? - 千篇一律
沿著“分析背景-分析目標-數據來源-數據清洗-指標解釋-建模過程-分析結論-分析建議”的步驟羅列內容,看似全面,實則對各部門無用。
- 無判斷標準,
5.如何寫建議
- 不要單純在數字上糾結
所謂建議,是業務部門可以做的一個具體動作。這個動作和業務工作流程有密切關系。要能夠達到一個大家認可的結果。無論是業務方的領導和下屬,都不關心具體的數字是什么,更不關心得出數字的模型是什么。他們關心的是可以做什么。做的事情要有依據,能服人就更好了! - 用數字支持的可執行方案
建議是需要執行的,但同時建議可能不利于業務本身。業務部門往往處于本位主義思考,提的建議都是對自己有利/自己想表達的,不能顧及事實,更懶得細致分類。
6.報告格式參考
- 總分總的格式:
一份數據分析報告由以下幾個部分組成,總結過去得失,原因得失是什么,建議怎么改進。
總:標題、目錄、前言
分:對比和細分貫穿報告,還有過程與結果。
各個行業都有自己成熟的分析方法和思路體系,首先我們需要懂運營和行業。按照行業的運營要素去寫。
總:結論,建議,附錄
- 標題:
標題是一份報告的文眼,是全篇報告最濃縮的精華。好的標題讓讀者能毫無偏差地理解這篇分析報告的主要目的,有時可以直接在標題中加入部分或者關鍵性結論達到直達文意的效果。
在標題的命名過程中,現在有一份關于數據分析師招聘和薪酬方面的一份報告,你可以:
直接在標題中放上報告的結論,例如《數據分析師在人工智能大環境下需求直線上升》
提出分析報告的研究問題,例如《數據分析師的職業規劃在哪里》
中規中矩地寫上研究的主題,例如《數據分析師的招聘研究》
- 目錄:
結構清晰,可按照運營分析的思路。論提現數據分析報告的整體架構
- 前言
前言部分就和寫論文時候的Abstract類似:
看你報告的人,不一定知道你為什么要做分析。比如你們部門的報告,公司老板要一份。
略微闡述現狀或者存在的問題
通過這次分析需要解決什么問題
運用了什么分析思路,分析方法和模型(可以在目錄中展示)
給出總結性的結論或者效果
給出數據來源,和時效性
如果是引用外部數據,引用多個數據源,需要標注數據來源統計口徑:統計的時間段,所遵循的統計標注
-
原則:
-
謹慎性
-
邏輯性強,架構清晰
建議和論證一定要嚴謹合理,分析思路的框架,一定要顯而易。
- 數據的準確性
證實可靠:反復核實數據、計算、分析方法;用實際情況交叉驗證。一次出錯就會失去信任。對于數據不能用可能兩個字回答。
-
結論明確
最好一個分析模塊只給出一個和主題關聯最強的分析結論,避免干擾
-
共識優先
圖表>表格>文字
圖像:PPT中的圖形一般只能來自EXCEL,來自python\spss等。通過專業軟件 做的圖表,不適合給非專業認識看‘例如方差。
文字和陳述:需要把統計學語言,翻譯為一般人可以看懂的語言,在寫報告的時候,把分析過程略去
術語:使用的的名詞需要根據各業務通用術語,避免口水話:
-
六.數據分析與運營體系
1.運營特點
-
活兒多分枝細
運營是個大工作,里邊的分支非常多。產品輔助:出產品設計、觀察產品效果;開發輔助:把產品需求做出來,維護產品運行;而運營是:除了以上兩個事以外所有事都得干。小公司的運營人少,就幾個兄弟上天入地,下海捉憋,把所有事都干了。大公司運營會有略清晰的分工和晉升線路。 -
本質是輔助
從本質上看,運營是個輔助性工作。理論上,如果產品力足夠強大,商品天下無敵,那根本沒運營啥事。可大部分產品\商品,同質化競爭嚴重,只能靠差異化的運營手段。因此需要運營打輔助,通過用戶激勵、促銷活動、內容傳播、商品運作等等手段,來保持用戶的新鮮感,促進用戶持續活躍和付費。俗話說:“產品不夠,運營湊”就是這個意思。 -
自帶具體指標
通過指標體系可以看到,運營會特別在意數據,幾乎所有工作都是圍繞數據工作,都是在“自然增長率”之上做疊加。單獨看每一類運營,都有一套自己的指標體系。此外非理性的運營種類工作中還有很多感性、情緒、創意,例如內容運營,對數據的依賴程度較低。如果數據運營把重點放在數據上,那最終就是淪為跑數機器的命。運營分工工作職責主要指標感性、理性數據作用備注 渠道運營 選擇渠道投放資源,拉新搞流量 投放數量、用戶轉化、銷售轉化、投放RoI 理性 中 講究策略性,需要觀察數據合理分配費用,改善轉化。具體則需要分渠道 用戶運營 通過獎勵、積分、會員等維護用戶新增、活躍、留存。 AARRR(新增、活躍、留存、轉化、轉介紹) 理性 高 特別講究策略性,AARRR各指標很難平衡 內容運營 內容創作用于內外部媒體投放:設計視頻、文案、廣告、供宣傳使用,通過微信、微博、公眾號、抖音、站內信等平臺影響用戶 內容全網點擊數、轉化數、漲粉數 感性 低 做內容特別依賴創作者的靈感和創意,數字只是結果 商品運營 銷售商品的進銷存管理 上架、進貨、銷量、庫存、利潤、周轉 理性 高 前期有感性的部分,后期都有周轉和銷量來定位 活動運營 組織活動,提升用戶、產品、商品指標 活動目標、參與人數、達標人數、活動ROI 高 高 數據為策略提供依據,但具體到每個活動力,影響因素很多:宣傳語、宣傳視頻、活動創意、代言明星等。 新媒體運營 兩微一抖等平臺日常運作 平臺粉絲數、內容點擊、轉發、轉化 中 中 產品運營 品體驗優化、升級、改版需求 產品路徑、用戶使用率、跳出停留的 中 中 -
對費用的依賴不同
運營分類缺錢程度用錢說明 內容運營 低 一個天才寫手勝過千萬刷閱讀量的錢 商品運營 中 需要大量錢采購商品,維持庫存,但一般企業直接將商品成本計入日常銷售成本,不會單獨撥錢,都是走流程 活動運營 中 看活動規模、投入力度,往往是大有大的做法,小有小的做法 渠道運營 高 非常缺錢。流量為王的年代,推廣渠道都是大爺,拿一分錢干一分錢活 用戶運營 高 無數的補貼大戰、紅包大戰、優惠券大戰告訴我們:用戶運營都是錢燒出來的。 -
部門間天然沖突
運營各自看數據,看似科學,實則帶著原罪:公司流程越長運營工作越需要相互配合,可各個部門的小團伙利益是天然沖突的,各自考核數據互相甩鍋的可能性越大。例如:- 用戶運營希望派優惠券吸引人,商品運營的利潤直接被榨干。
- 活動運營希望短期效益越大越好,用戶運營的節奏直接被帶垮。
- 商品運營希望不打擾爆款,多出尾貨,可活動、用戶運營都要硬貨支持。
- 內容運營寫《震驚!馬云!華為!沸騰!》篇篇百萬閱讀,可最后沒轉化。
-
不需要太多創新
運營之所以喜歡說迭代,首先是因為運營幾乎都有方法庫:有大量的基礎套路、模板、案例可以參照,完全不需要從頭做起。所以不需要用“創新、設計、創造”這種詞。例如:運營最喜歡說的AARRR,其實每個方面,都有大堆套路.
其次是隨著環境變化、企業規模擴大,即使套路總不能一桿子捅到底,總會隨著時間變化有些變化,但其實大部分的骨架和邏輯不咋變,100%創新才是異類。這種變化可以分為五個等級(如下圖已優惠券設置為例):
-
運營工作是一個循環往復的過程。
五個等級的創新變化 ,會按照流程循環:了解現狀 →發現問題 →尋找方法 →落實措施 →觀察結果 →新現狀 。通過監控數據發現問題,之后在方法庫里尋找方法,看看是直接疊加幾條規則,還是改個參數,還是改個形式。 -
天然痛點
增長需要投入和創新,而投入需要平衡,創新也會過時,成本永遠比效果跑得快,復雜的市場造就了糾結的運營。以用戶運營為案例:
菜鳥眼中運營數據分析無非(是滴,外行很喜歡用無非這倆字)就是AARRR與漏斗模型,還喜歡提用戶畫像,而實際這上都是描述性統計,告訴的是一個結果。這些數據需求只要做了報表就能固定。但運營真正痛點,并不是:不知道結果是啥樣,而是:結果就這樣了,我搞來搞去領導都不滿意,咋辦呀!- 沒錢。
《拼多多最新策略》——你給打了人家那么大折嗎?、《瑞幸成功十大經驗》——你給得了人家那么多券嗎?、《滴滴用戶增長黃金法則》——你給得了人家那么多補貼嗎?但然而偏偏有一派領導喜歡不給錢的辦法 - 有錢,沒效果
想象中:活動中,用戶熱烈參與;活動后,網店氛圍被炒熱,新人持續優化……現實中:活動中,沒幾個人響應;活動后,立馬打回原形。短期內搞指標很容易,搞完以后一地雞毛也很常見。 - 有效果,但領導要求越來越多
“首單有了,二次消費好像又不行“二次消費有了,都是小單,GMV上不去“反正都投了這么多資源了,要畢其功于一役!“你再多想想,要掌握底層邏輯,核心思維,不要光砸錢” - 有效果,但領導說“不能一條腿走路”
1.你看新人都靠這個活動,沒有活動了咋辦2. 你看人家PDD都有新玩法了,我們不能這么因循守舊,總之只有一種形式是不行的,繼續創新。創新嗎,又要看數據、做測算、分析需求、設計規則、測試效果、效果不好繼續糾結:該怎么創新。 - 有效果,但現在又沒錢了……
想在短期內、單一拉升某個指標,只要砸錢就能實現。但不見得每時都有錢投入,
- 沒錢。
2.數據運營
本質是運營。真正價值不是拿來當跑數機,而是建立一套從整體目標出發的數據考核機制統一協調各部門的:錢、時間、責任,既能讓各部門跳出小圈子,達成共識目標,又能讓各部門落實方法、跟蹤進度,反饋問題,共同為“增長”服務的辦法。
3.數據運營體系搭建方法
第一步:共識整體目標,制定整體戰略。
各個運營小組,共識年度大部門整體目標(比如DAU、轉化率、銷售金額等),并且選擇落地大目標的戰術,把大目標分解到各個月。
注意分解方法可以有:階梯增長型:不指望爆款,毎個月穩步推進;新品引導型:指望新版本推岀/爆款引入,圍繞一個重點俽;重點突破型:指望關鍵節點(68、雙十一)引爆銷量,平時做輔助。選擇策略關鍵看業務上有沒有做好相關準備,比如是否有足夠的持續投入資源,比如爆款是否真的指望的,真的夠爆。以及萬一沒有爆,第二手準備是什么。
第二步:設定階段性重點,各小組分配任務。
從上自下,在凊晰整體目標的情況下進行分解,越落地,越有任務主次之分,執行起來各自任務很凊晰,也便于選執行
比如上圖,大方向是求轉化,實現盈利,具體策略是活動拉動,因道、商品、活動運營要抗大旗。也有可能是追求增長方向,渠道、用戶運營扛大旗。
第三步:分解階段性指標,各部門執行、監測、反饋。
這一步就是常規運營數據指標的監控過程,不再贅述了。有了前兩步,每階段的運營工作就有了清晰的主任務,就不用糾結在“為啥短期類活躍率降了”“到底自然增長該寫多少合適”“又有幾個客戶投訴很激烈”——整體目標達成就好。細節問題,可以在各小組自己復盤的時候,再找改進點
第四步:監控執行進度,從下向上檢討效果。
為了避免甩鍋,效果沒達到使用檢討三原則:在執行到位前,不質疑策略;在投入可調時,不修訂策略;在策略失效前,不質疑方向。所有人盡全力完成,
4.根據KPI設定目標的方式
活動目標是KPI指標, KPI分解法
KPI分解法往往用于銷售額、利潤、新增用戶數等可累加的,直接結果類指標(不太適用于比例、比率類指標)。常見的做法是:先定全年整體目標,提升觀之后按過往規律,按月份區域等比例分解下去,落實到每個月。(注意下圖中,因為春節原因,1、2月份手動調整,這種方法適合季節性規律強的業務入援地氣字)
活動目標是KPI的過程指標,KPI倒推法
KPI反推法往往用于活躍人數、注冊人數等過程類指標或者轉化率、ⅥP占比等比例類指標。常見的做法是:假設一個固定轉化率,比如活躍用戶付費轉化是10%,人均付費200,那為了拿到1億銷量額,饉推,需要至少活躍用戶超過500,且轉化率不低于10%這種假設看和復雜,但實際上,運營指標是有波動范圍、季節規律的,有歷史值可參考。
活動目標是KPI關聯指標,KPI場景法
KPI場景法適用于與KP直接關聯小,但業務邏輯上很重要的指標。比如滿意度、市場知名度、鋪貨率等等。這些指標通常不直接和KPI關聯,但是滿意度太低,知名度不夠,鋪貨速度太慢,就是會讓用戶覺得你的產品不行,不想買。在數據上,往往呈現拐點效應如左圖,低于某個值后迅速下跌)或前后效應(如右圖,得一前一后才有快速增長趨勢)在設目標的時候,常常設成:不低于x數值,或者在X日達到X數值
5.如何支持運營迭代
先回答和錢有關的
與錢有關的通常是戰略方向性的問題,因此數據化運營中,從一開始制定共識目標,到后面各運營部門都應該厘清與錢有關的問題。每一類業務在各個階段,規模、收益需要量化,才能精細化運營。例如:1. 公司發現目標是(行業第一?營收破100億?)2. 基于此目標,需要新用戶XX萬,老活躍用戶維持在XX水平3. 基于新用戶數,按目前市場價,渠道成本為XXX億4. 基于目前措施,老用戶維護成本為XXX億 5. 以上目標,通過階段性大促完成x%,日常渠道/用戶投入X%
發現問題是重點
在運營的五步循環中發現冋題環節是最混亂的,也是最需要數據分析支持的。明確除了責任的劃分,最終落實的問題點會直接影響決策!例如:用戶活躍率低了,到底是因為新人進來就出了問題,還是后續運營沒做好,還是對手發力了。
了解現在和觀察效果是數據分析的日常工作。報表類工具能夠搞定
找到運營的痛點,進行輔助分析
6.事后如何目標數據
如果事前沒有定目標,一定要事后補救的話, 牢記:核心不是什么自然增長率,而是“業務到底需要把指標做成什么樣子”。特別是整體目標已經撲街的情況下,事后再糾結自然增長率,往往會淪為甩鍋大戰。這時候可以分三步做
先根據往年趨勢+本年前幾個月走勢,結合目前KPI達成情況。定出來到底我想把曲線做成什么樣子。定義好目標以后,不管自然增長率是多少,都努力往目標靠攏
活動標桿法的潛臺詞,就是:從直接產出(活動是拉活躍率,就看活躍率)上看,本次活動投入:產出比,和過往同類活動相比,很好不好,所以如果大家想花錢買指標上漲的話,本次的形式可以繼續用/不要再用了
區分不同用戶群體,看看這個活動到底是誰在玩,哪個群體提升的多,找到活動主要影響對象和能影響的程度。基于這個分析判定:活動真正影響到誰,對誰效果好,是否適合推廣到其他群體。注意:有同學喜歡拿平均值整體值當標桿這是很粗糙的做法。很有可能用戶在參與時,“好的者好”“差的更差”的問題先分組,每組找標桿是個好習慣。
7.如何給運營提建議
做數據分析的,要對業務常存敬畏之心,不然光空口白話,會被人笑話的。提建議很難,總覺得提的不夠細,其實主要是思考的不夠細導致的。如果一上來只有一根曲線,沒有走勢分析,沒有結構分析,沒有標桿,肯定建議也細不下去。甚至連“要不要搞高”這么簡單地建議都會提的毫無依據,很容易被挑戰。
下圖是某個電商一周銷售金額走勢(具體數據都差不多,總之曲線長這樣),問:數據反映什么問題,怎么提運營建議?
“要搞高”三個字說起來輕松,可做起來一堆問題:為什么非要搞高?要搞到多高才算高?市場搞高還是銷售搞高?用什么型號的產品搞高?啥時候開始搞到啥時候?
用剝洋蔥的方法,層層深入,每一步都基于之前獲得共識的判斷,每一層都是數據分析可以解釋的。這樣能非常有效的助力業務思考,也不容易被推翻。
-
從最簡單的:“是什么”這個問題
判斷問題是否存在。為什么要搞高是最初的判斷,也是最重要的判斷。判斷錯誤會把整個方向帶歪,搞得大家興師動眾勞而無功,所以一定要慎重。
前提是有標準:判定這個數是低。我們得綜合趨勢、品類周期性、任務目標,綜合下結論。至于數值代表的好壞需要深入分析
-
再問‘是多少’的問題?
問題存在則需要,就要確定有問題的嚴重性,基于此才能制定目標要搞多高。
此時數據分析可以:事后KPI考核。
很多人會說:不是越高越好嗎?顯然不是!應該是:在投入一定的情況下,越高越好。你的商品主管、用戶運營、產品經理、網站開發在短期內的投入能力都是有限的,因此得定個合理的小目標:- 參考標準1:KPI。可以計算做多多少才能補齊KPI
- 參考標準2:自然周期。可以計算看多做多少才能讓業績曲線保持過往周期性運轉,至少止住持續下跌的態勢。
- 參考標準3:生命周期。可以看按目前生命周期,預計商品還有多少周銷量,再看要做多少才能趕上節奏,避免后期積壓。
-
再問是哪里搞出來的問題
如何解決問題,想提有用的建議,得先明確是提給誰的。這就需要確定出問題的位置,確定出問題的地方,也就能找到干活的人。要分析為什么低?是哪里出了問題?利用分析思路拆解問題,具體到可執行單位。
例如:產品部交易平臺出現了bug、市場部競爭對手有動作、商品部產品斷貨、 -
再問能怎么整這個問題
“怎么做”是不能直接從數據層面推導,而且不同部門可以干的事是有區別的,要業務的專業判斷。數據可以做的是, 1.上次出現類似情況,是如何處理的;2.常規措施,促銷、新品、用戶活動,大概投入產出多少。- 流量運營:為全站引流,分配流量
- 商品運營:商品選款、上下架、補貨
- 活動運營:促銷活動、宣傳活動
- 用戶運營:給制定用戶發券
- 產品經理:調整購買路徑
-
再問這次可以選哪個手段
到底用什么手段,用多少投入。之后才是細節:具體哪天上什么產品,優惠力度是多少,發券面向多少人……在更細節層面,比如券面額,活動形式上,可能還得配合一些ABtest才能得到最后結果。
8.遇到人為阻力,如何解決?
只會喊:疼疼疼的病人還不是最討厭的,起碼他有治病的意愿,還能溝通。不配的病人5才是最棘手的:
1. 經驗主義:老夫從業20年,不符合我的感覺的都是錯的!
2. 拒絕面對:誰說我做的不好!我不做業績更差/全行業都不好!
3. 拒絕投入:項目上線要快,所以埋點就省了吧/數據治理太麻煩,業務要快!不搞了!
4. 篡改數據:人為刷流量、刷閱讀/活動規則留薅羊毛的空間/改目標、參照組
-
注意:
這已經不是分析思路的問題了。現在的問題是,這些人胡攪蠻纏,試圖甩鍋。用理性、正常的邏輯和他們無法溝通。這時候需要的是對付敵人的手段。具體來說,是如何推進項目的戰術。所以真遇到這些人,請不要懷疑自己的思路出問題,而是看怎么趨利避害,爭取一個好結果,至少不白白背鍋。 -
把業務上理由轉化為數據上論證。
數據不能論證的理由就閉嘴,是個非常好的議事規則.
-
堵住借口:找借口并不能解決問題,因此先把各種逃跑路線堵上,集中精力想能干點啥。
往往借口產生于:宏觀因素、外部因素、隊友因素。所以在這里,關鍵是證偽。只要能推翻他們的逃跑借口就行。證偽最好用的辦法就是舉例法,同樣是下雨,為什么別人就抗的住。同樣是流量難搞,為啥別的業務線能持續增長? -
找到癥結:在一堆影響因素里,從大到小,從粗到細,先搞大問題
- 解決白犀牛,剔除明顯的重大影響。
重大因素表現在數據上,有嚴格的要求:開始錢指標無問題、開始后指標下降、并且保持同步。例如:監管政策、公司戰略、重大外部環境等等因素,確實會對企業經營起到重大作用,并且這些因素是普通小員工只能接受,不能改變的。 - 解決黑天鵝,剔除明顯突發事件。
正向的:促銷活動,某群體用戶騷動,新產品上線……負向的:惡劣天氣,突發事件,系統宕機……;會有明顯的數據趨勢。 - 按照問題鎖定部門
因為部門職責固定,所以一般找到問題環節( where),再細分看這個環節在哪些群體(what)問題比較大,就能鎖定負責部門(who) - 鎖定細節問題
即使聚焦到一個部門的一個行動,還是很難扯清楚:到底是什么業務上原因導致的問題。這就需要具體的分析。
- 解決白犀牛,剔除明顯的重大影響。
9.復雜任務
數據分析喜歡的復雜問題往往是,數據完美,含義清晰,靜靜躺在excel表里等著被建模,然而這也是企業真實的經營場景,負責問題同時存在以下多種問題:
- 部門利益有沖突
一項綜合指標,會涉及多部門的責任。 - 指標含義不清楚
存在很多主觀指標,依靠問卷調查,效率低出錯高 - 原始數據內容亂
例如客戶投訴內容,很難準確界定客戶的真實訴求。 - 相關流程要改動
打破業務流程一定會遇到阻力
七.數據標簽
1.打標簽
- 標簽:
標簽是數據的沉淀,由原始數據,經過整理、加工、分類所得,一個抽象的符號,代表一類人/物的特征。用來描述商品的,就是商品標簽;用來描述業務的,就是業務標簽;用來描述用戶的,就是用戶標簽了。
標簽往往是過往分析成果的沉淀,高效實現更復雜、更精準的分析。如果不打標簽,每次都基于原始數據分析,做效率太低,并且能思考的維度太少。 - 打標簽
打標簽,就是個循序漸進的過程::打標-驗證-積累-二次打標,可以從簡也可以很復雜。
打標:從原始數居直接分類得到初級標簽’。不斷根據維度添加標簽,之后多個標簽組合,生成綜合標簽。當多個標簽一起用于評估,可能采用分類或降維算法。
驗證:標簽是預測來時,需要用預測算法。最后評價標簽有沒有區分度,關鍵看打標以后,各類標簽在目標上差異,所以清晰目標很重要。我們常說的用戶分層,最后結果vP1/2/3,也會是一個標簽。所以打標簽可以做的很復雜。 - 注意:
- 根據業務場景打標簽
即使是同一個原始數據,在不同場景下,標簽完全不同。拿用戶年齡舉例:醫療、游戲、工作三個背景下,年齡的分層不同。 - 根據業務需求打標簽
標簽不能缺少檢驗,不能為了打標而打標。正確的標簽可以有無數,但基本都無效。從結果出發,打用戶標簽是希望區分用戶,那么最后區分效果,在目標上的差異越大越好,如果差異不大,那打標意義就不大,可以取消標簽,或者再做優化。 - 多維度定位
標簽是基于歷史的確定面對未來,工作量大、需要跟著數據不斷更新。不能簡單基于歷史數據統計,得基于測試或者建模預測才能得到結論。 - 歸因謹慎
以用戶標簽為例,在推導購買動機的時候要特別謹慎,因為錯誤的、隨意的歸因會誤導業務行動。用戶的行為是多個標簽共同的作用,而且存在不確定性,明明用戶喜歡的是打折,結果缺誤判為產品粉絲,最后很有可能狂推一堆產品卻沒有響應。 - 不同類目標不混合
降維要注意:做數據的同學嫌一個維度一個維度切分不體現數據能力,非得整個模型,算個權重才顯牛逼。比如評高價值用戶,把活躍度和付費金額,付費金額和毛利幾個指標混合在一起,美其名曰“綜合評價”。結果搞出來一毛不花天天白嫖的用戶也是高價值用戶。要是都這么折騰公司就得破產了。
- 根據業務場景打標簽
2.標簽發揮作用
- 融入業務/業務系統中。
一個用戶標簽。它和商品條碼一樣,起到了串聯作用,如果沒有把標簽融合進業務系統,業務流程里去。沒有CRM,OMS,WMS等系統配合,用戶標簽也就只是個數字標簽,沒啥作用。 - 案例:為VIP用戶到店及送一份果盤”
- CRM系統已有VIP用戶標簽,可識別注冊會員的身份(是否VIP)
- VIP用戶有果盤權益(包括權益名稱、權益有效期,權益數量有幾次)
- 門店有服務流程(誰確認會員身份、誰負責果盤備貨、誰服務端出來)
- 系統有權益使用流程(識別身份、使用權益、核銷權益)
- 系統記錄扣減果盤庫存,關聯到會員卡消費記錄。
案例中:有了成套配套,整個流程才跑的順:會員到店以后出示微信卡包,亮明身份;店員點擊使用果盤權益,掃條碼果盤出庫,端給會員吃。各個流程都有數據記錄,這個權益才能真正落到會員身上。不然少了環節,就會產生灰色賬目。
3.用戶標簽
- 用戶標簽
代表用戶特征的標簽,是用戶畫像、精準營銷、個性推薦、智能投放等等各種系統的磚石。 - 作用
高效精準地細分用戶群體,鎖定更有需求的人,實現更精準的營銷/服務。
這里為舉例簡單,間化了很多過程,實際上想鎖定用戶,需要抽很多標簽,做多次探系:- 第一步:識別
根據消費力+互動標簽,初步識別客群; - 第二步:鎖定
按本次活動目標,鎖定一批高消費用戶 - 第三步查:洞察
看能反應需求的標簽,選中促銷敏感度標簽,以此下手,推促銷活動 - 第四步:跟進
觀察活動響應情況,驗證促銷敏感度標簽區分效果
- 第一步:識別
八.用戶畫像
B2C用戶畫像
基于畫像我們可以進行精細化的運營,通過數據層的“事實標簽”,在算法層進行計算,打上“模型標簽”的分類結果,最后指導業務層,得出“預測標簽”
沒有經過加工的事實標簽,比如用戶性別、年齡、消費金額這些,是很少具備指導意義的。真正有指導意義的是經過數據檢驗的:二級、三級綜合標簽,比如“興趣”“愛好”標簽,很難直接獲得,需要通過復雜的分析過程。
接地
設計唯一標識
用戶唯一標識是整個用戶畫像的基礎,串聯用戶的所有行為。
例如:用戶名、注冊手機號、聯系人手機號、郵箱、設備號、CookieID 等
給用戶打標簽:
數據層,建立事實標簽:指的是用戶消費行為里的標簽,作為數據客觀的記錄
| 消費習慣標簽 | 付費程度、消費品類、購買意向、是否對促銷敏感、投訴次數購買次數、優惠券使用頻率、 |
| 行為習慣標簽 | 時間段、頻次、時長、訪問路徑、支付渠道 |
| 內容分析 | 停留時間長、瀏覽次數,類別,比如,金融、娛樂、教育、體育、時尚、科技等。 |
數學建模
算法層,模型標簽:透過這些行為算出的用戶建模,作為用戶畫像的分類標識。挖掘海量數據進行標簽化,來得到精準的用戶畫像。挖掘時,需要根據場景進行用戶分類,并對比各類用戶與總體間的差異,這樣才能保證分析結果的可信性和適用性,而TGI指數就是很好的對比指標。
| 消費習慣標簽 | 購買偏好、滿意度、支付偏好、優惠券偏好、RFM標簽 |
| 行為習慣標簽 | 活躍度、、 |
| 內容分析 | 用戶興趣、 |
劃分業務價值
業務層,預測標簽:指的是業務層指的是獲客、粘客、留客的手段,作為業務關聯的結果。從用戶生命周期的三個階段來劃分業務價值
| 粘客 | GMV預測、個性化推薦,搜索排序,場景運營等 |
| 留客 | 流失率預測,分析關鍵節點降低流失率。 |
B2B的用戶畫像
-
B2B業務本身特點:
一線!!- 獲客成本高,方式傳統
B2C業務的精準營銷、個性推薦,最多是把換成地毯式轟炸,使用企業力量VS個人。做B2B的精準營銷,則是靠懷絕技的銷售,B2B采購流程長且復雜、涉及人事多,幾乎銷售VS企業。
意味著銷售們要花大量時間在客戶身上,給一堆餅圖、線圖、條形圖,是根本沒有人看。
- 客戶流失損失大,挽回難
用戶在京東買東西,不去淘寶買,可能淘寶砸一個優惠券人就回來了。但一旦乙方在甲方失去聯系,甚至被打入采購黑名單,以后就永遠失去了每年數以百萬計的生意,就是這么殘酷。丟失一個老客戶慘過開發10個新客戶,在B2B領域更成立 - 數據收集,依賴于渠道的管理
做B2B業務的銷售,都是把客戶的信任當作私有財。渠道管不住,收回來的就是無效數據。這就需要公司管理:信息化工具+紀律+數據校驗 - 不存在所謂RFM
或者說只有M,沒有R,F,越是大企業采購越是這樣,銷售過程很長,但一旦銷售完成,客戶可能今年都沒有需求。
- 獲客成本高,方式傳統
-
基本畫像
| 用戶名稱 | ID | 企業名 |
| 基本特征自 | 自然屬性為主:性別、年齡、地區 | 經營屬性為主:行業,行業排名,企業規模,發展速度 |
| 用戶角色 | 自然人 | 審批者(各部門大佬)、采購者(采購部經理、主管、職員)、需求者(需求部門經理、主管、職員)、使用者(各種角色) |
| 用戶消費行為 | AAARR | 售前動作為主:需求發起,溝通,演示,評標,中標結果 |
| 用戶互動行為 | 在線點擊、線下到店 | 采購行為(多少次進度,每次進度到哪一步),溝通內容(咨詢人,咨詢問題,應對案,后續反饋)使用行為(使用人次,使用建議) |
- 行為分析
- 線索數據
有沒有最初的銷售線索來源、到達時間、可靠性記錄 - 用戶角色數據
有沒有客戶采購流程的進度記錄,對應的客戶角色(不是企業名稱)記錄,審批、采購、需求、使用者。 - 跟進數據
有沒有銷售跟進次數、時間的記錄:我方跟進了多少次,客戶進度推進到什么程度、有沒客戶問題溝通的記錄 - 經營情況和部門架構變動情況
有沒有采集客戶的行業、經營情況、行業排名、發展速度數據?營業收入從100億成長到200億,需要的服務器,系統功能,licence數量都必然會增加 - 用戶分類:
有沒有預先客戶分類,比如哪些是開拓重點,哪些是現金牛
- 線索數據
九數據處理
數據的質量最終決定了數據分析的準確性 現實生活中,數據并非完美的, 需要進行清洗才能進行后面 的數據分析 。常規數據分析、數據挖掘開始工作前都要:明確數據情況、統一數據格式、
錯誤數據的來源:人為失誤、歷史局限、刻意隱瞞、特定業務操作,數據采集問題,數據同步問題。
1.數據探索 Explore
內容:
對于數據的探索,是基于業務規則和分析需求。是否符合業務規范,是否能滿足數據分析的要求。除下表之外還需要注意表外的要求:數據來源、記錄時間、內容準確性(交叉驗證)。
| 含義 | 具體定義 | ||
| 數量 | 合理的記錄數 | ||
| 缺失 | 缺失哪些字段 | ||
| 范圍 | 數值范圍、文本內容 | 離群值、異常值的數量、大小 | |
| 唯一性 | 是否具有唯一性 | 是否符合字段要求:完全重復行/部分重復 | |
| 非空性 | 是否為可以為空 | 是否符合字段要求 | |
| 默認值 | 是否存在默認值填充 | ||
| 數據類別 | 數值/文本 | 是否符合字段要求 | |
| 數值格式要求 | 保留位數、單位要求 | ||
| 數值分布 | 離散/連續分布 | 箱線圖法(分位差法)或者分布圖(標準差法 | |
| 文本分布 | 各文本數據項分布情況 | 是否符合規定的文本要求 |
操作:查數據
2.數據修正 Modify
主要是處理異常值:缺失、重復、錯誤值,處理思路:
分析情況
異常值在字段中的分布,以及是否有顯著的規律分布特征。
判斷:
- 是否需要處理:處理后續模型中是否能夠自動處理,是否涉及此字段
取決于后期數據分析和模型的容忍度和靈活度。
- 具體情況具體處理
常用處理方式
- 丟棄字段
丟棄意味著削減數據特征。不宜采用這種方式。當存在大量異常值,缺失值,比如超過10%、50%;或者缺失的數據很大程度影響數據分布特征。
-
補全/替換較為常用,補全方式有 :
-
統計法
數值型數據:使用平均值,加權均值中位數。
分類型數據:眾數最多的值
-
模型法
基于已有的字段,將缺失值作為目標進行預測。
數值型:回歸模型;分類變量:分類模型。
-
替換法
有均值替換、前向、后向替換和常數替換、上下限替換異常值
-
專家補全
-
其他
例如隨機數,特征值,多重填補
-
-
刪除記錄
完全重復記錄、數量相對較少刪除后不影響數據分析
- 修正
主要是針對格式錯誤的數據
數據操作:增、刪、改
注意:
-
偽異常
當遺產是由特定的業務動作產生,能夠真實反映業務的狀態,并且需要分析異常情況時,這些數據不進行處理:業務峰值、信用卡欺詐分析
3.數據轉化
數據操作:增、改
數據類型的轉換
數據歸約
數據歸一化處理,
數據聚合
-
數據合并
橫向堆疊:將兩張表或多張表在X軸方向,即橫向拼接在一起,行數相同 ,
縱向堆疊將兩張表或多張表在Y軸方向,即縱向拼接在一起
4.工具
工具
十.分析方法
1.數學分析框架
高級方法是簡單方法的疊加,新模型是舊模型的進化,關鍵是如何實現
單維分析
對比思想是所有的的基礎,分為:自我對比、其他對比
-
橫向對比:同一時間點上的兩個并存事物的比較。
-
定比:kpi、預警分析
-
環比:
本周期 和上周期整體比較:例如2005年7月份與2005年6月份相比較稱其為環比
環比增長速度=(本期數-上期數)/上期數×100%
環比發展速度=本期數 / 上期數×100%
-
-
縱向對比:單個事物在周期內不同時間點上的狀態進行的比較
同比:本周期 和 上周期的同一點比較:避免周期性波動 -
趨勢圖
單維度分許:分析整體的趨勢、周期性、異常值
描述:上漲、快速上漲、上漲趨勢減緩、急跌、反彈、下趺、快速下跌、蕩下跌
多維分析
-
ABtest
應用場景:體驗優化、轉化率優化、廣告優化、算法優化
環節設置:現狀分析、假設構建、人群分流、目標設置、A/B/n版本制作、數據收集、結果分析:通過用戶行為分析用戶心理,從而優化產品用戶體驗 -
象限分析法、
實現:多維度分析,對數據在不同維度進行交叉展現細分數據,一般是兩個維度。根據不同的業務場景和業務需求,將任意兩個指標作為坐標軸
例如:BCG模型/類BCG模型。分析渠道——通過用戶的質量和數量分為四個部分;品牌的狀況——品牌GMV增長率和占有率;商品引流能力和轉化率:流量份額-轉化率;商品對毛利/GMV的貢獻:毛利率-銷售額
-
指數體系分析
(數學基礎中有詳細解)確定不同因素對結果的影響大小
分類分析
- 決策樹
- 神經網絡
- 貝葉斯分類
- SVM
- 隨機森林
流程法
-
漏斗分析
-
結構分析
場景:app功能分析;菜單級別
-
路徑分析
相關性分析
-
熱力圖分析
基于鏈接的熱力圖
基于像素的熱力圖 -
聚類分析
-
回歸分析
-
關聯分析
聚類分析
- 層次分析
- K-均值
- 模糊聚類
- 高斯回歸
回歸分析
- 線性回歸
- Logistic回歸
其他
- 時間序列分析
- 歸因分析
線下平均歸因
時間衰弱歸因
根據位置綜合歸因
2.行業與公司框架
宏觀背景決定行業風口,風口決定公司的發展。基本的研究框架:
-
產品
這個行業的主要產品是什么?
產品的主要形態是什么?
滿足了用戶哪一方面的需求?
產品的替代品包括什么?
產品的關鍵技術是哪一項?
產品的成本結構如何?-
產品生命周期PLC
product life cycle,產品的生命都是有限的、不同階段的目標、措施不同
階段價值戰略指標用戶 開發 時間 引入期 反饋 成長期 增長 成熟期 利潤 衰退期 -
品牌
AIPL+FAST:AIPL:品牌在品牌體系里的人群資產定量化運營,FAST模型:從數量和質量上衡量消費者運營健康度模型
-
-
市場
公司的市場定位?
公司的主要用戶?
市場空間有多大?
近幾年的市場增長率有多高?
預計未來幾年的市場增速如何?
市場的主要玩家是誰?-
戰略鐘
市場價格
-
STP市場定位理論
市場定位
-
SWOT
競爭
-
-
行業概括
基本的行業術語
行業的發展歷程和變遷
行業的監管情況和主要政策是什么?
行業發展的有利因素和不利因素
行業發展的瓶頸
行業目前所處的周期
行業的供應鏈情況?-
PESTEL
用PESTEL模型分析,這個行業大環境如何?
P:政治因素,是否是公有設施行業?是否受到政策和監控的嚴控?如房地產
E:經濟因素,哪些經濟因素影響了這個行業的發展?如奢侈品
S:社會因素,社會風俗和思想開放程度對這個行業有多大的影響?如醫美
T:技術因素,技術是如何影響這個行業的?如手機
E:環境因素,環保政策和環保理念如何影響行業發展?如新能源汽車
L:法律因素,某些法律法規的出臺對行業的影響,如廣告法影響自媒體等。 -
生態譜圖
供應鏈情況分析
-
-
競爭
行業的競爭情況如何,是完全競爭?寡頭壟斷?還是寡頭競爭?
業內幾個主要玩家的盈利模式分別是怎樣的?
在競爭勝出的關鍵行業因素是什么?
該行業是否受到海外競爭的壓力? -
近期的特殊事件。
譬如中概股最近遭遇做空,包括愛奇藝、好未來等,如果你正在看教育行業,那這件事情是你應該關注的。對于這些特殊事情,你在知乎上搜索也能找到很多的數據和各方說法,看個3-5篇的深度分析,對這件事情至少能夠在與一般人交談時比別人多出大概5%的談資。
從哪里獲取研究所需的報告和數據
如果是為了看行業總體數據,可以上國家統計局和對應的行業協會官網,對于行業研究報告,推薦以下幾個地方:
1、證監會官網
在證監會官網上可以找到各個上市公司的上市時候的招股說明書,這是券商針對公司情況出具的一份翔實的報告,里面的行業部分通常是券商經過仔細的調研得出的情況,當然如果是太小的券商出具的報告,有可能深度不夠。可以找一下中金、招商、中信證券等大投行出的IPO對應行業的某家公司的招股說明書。
2、巨潮資訊
證監會指定的上市公司公開披露信息的網站,在上面可以找到各個上市公司的定期報告和招股說明書等。
3、東方財富網
對于未付費用戶,每天可以免費下三份報告,找報告的時候同樣挑選一下出具報告的券商,還是建議看幾個大投行的。
4、萬得
這個是要收費的,而且很貴,一般人都不會買,大部分情況下是公司買了給員工用。如果你有朋友在金融機構,可能他手里有公司發的賬號,你可以麻煩他下幾份。如果嫌麻煩,某寶上或者某魚上搜一搜,便宜得很。
5、網站:發現報告
這個網站上有“行業研究”、“宏觀策略”、“公司研究”、“招股說明書”和“其他報告”四個板塊,每天會新增幾百到上千份報告,報告來源于其他各個網站,包括消費、互聯網等,常見的行業一般能在這上面搜到。
6、網站:并購家
這個網站關注的是行業內的并購事件,也能在上面找到各個行業的報告。
7、網站:行行查
上面有行業數據、法規、技術變革、競爭格局等,是我最近用得比較多的一個網站,上面還會根據關鍵字提取報告中的內容,譬如“商業模式”“產業鏈”等。
3.電商數據分析
無論何種形式的電子商務,GMV( Gross Merchandise Volume 成交總額)是電子商務的核心指標,從計算角度來分析:采用杜邦分析法即GMV= 用戶數*客單價;從管理角度分析最具有代表性的框架為:人、貨、場。
提示:對應指標在指標篇中,此處不展開
用戶分析
用戶定義:?包括:用戶行為、用戶價值、用戶構成
用戶心理:(現在無法落地到數據暫時不展開)馬斯洛需求:生理需求、安全需求、社交需求、尊重需求、自我實現
客戶生命周期模型
AARRR
? 用戶行為分析
AARRR是一個思考的框架,不是五個指標。
每個方面下邊都有一堆指標可以看;因為每一步的達成都需要眾多部門合作。
不是一個用戶必須走完五個流程,運營時也不是分布進行
用戶具體行為并不一定,而且運營中存在同步進行,基本是作為一個整體,關注的五個方面
不是說每個方面都得做到極致
不同的業務, AARRR形態不同。有的業務就是靠大量轉發裂變,有的就是靠大量不付費用戶撐起臺面,有的就是流失很嚴重,但是沙里淘金服務幾個大客戶。所以得具體問題具體分析
-
Acquisition 獲客
-
戰略:獲取新用戶
-
戰術:拉新,運營主要的目標是引導用戶下載應用,完成注冊
-
戰斗:精準定位,發掘渠道,
通過SEM、SEO、CPS、ASO、換量、積分墻以及一些線下渠道,找到并發現目標用戶,將用戶引入體系中來并誘發使用,完成這個階段的目標。最終引入用戶的渠道質量和匹配度,將決定用戶的有效轉化率和留存率。還有就是落地業等產品端的價值傳達。
-
指標:用戶增量、獲客成本
-
-
Activation 激活
- 戰略:留下目標客戶群
- 戰術:用戶體驗
- 戰斗:
- 指標 :DAU/MAU、登錄次數/時長、活躍功能點
-
Retention 留存
-
戰略:留存率衡量著一個產品是否健康成長。
-
戰術:減低流失
-
戰斗:
當新用戶在某個時間段內、按照某種頻率使用某個功能,則該用戶在本平臺的留存概率將最大化,進而成為忠誠用戶。
-
指標:次日、3、7日、30日、90日留存率、生命周期長度、流失預警+重定位
-
-
Revenue 收益
-
戰略:傳播
-
戰術:精準營銷
-
戰斗:交叉營銷
基于平臺現有的產品類別,流量、爆款、利潤款,以各種運營手段配合,促成用戶完成多次復購
-
指標:ARPU、LTV、消費金額、頻次、消費商品
-
-
Referral 傳播
-
戰略:復購
-
指標:傳播用戶數、傳播質量、K因子
-
戰術:誘導用戶對于平臺產品和服務進行傳播。
通過用戶推薦再次獲取新用戶,應用運營形成了一個螺旋式上升的軌道。而優秀的應用就很好地利用了這個軌道,不斷擴大自己的用戶群體。
-
RFM:
-
介紹:用戶相對價值的劃分的經典模型,
Recency最近一次消費時間間隔理論上,上一次消費時間越近的顧客應該是比較好的顧客,對提供即時的商品或是服務也最有可能會有反應與顧客建立長期的關系: 如果顯示上一次購買很近的客戶,(消費為1個月)人數如增加,則表示該公司是個穩健成長的公司;反之,如上一次消費為一個月的客戶越來越少,則是該公司邁向不健全之路的征兆。 Frequency,消費頻率,一段時間(比如1年)內的消費次數 消費頻率是顧客在限定的期間內所購買的次數。我們可以說最常購買的顧客,也是滿意度最高的顧客。 最常購買的消費者,忠誠度也就最高。增加顧客購買的次數意味著從競爭對手處偷取市場占有率,由別人的手中賺取營業額。 Monetary,消費金額,一段時間(比如1年)內的消費金額 消費、消費頻率、消費金額是測算消費者價值最重要也是最容易的方法,而其中,消費是最有力的預測指標,消費金額決定客戶重要性 也所有數據庫報告的支柱,也可以驗證“帕雷托法則”(Pareto’s Law)——公司80%的收入來自20%的顧客。 -
分類
“忠誠度的階梯”(loyalty ladder),其訣竅在于讓消費者一直順著階梯往上爬,實際運用上,我們只需要把每個維度做兩分即可,這樣在3個維度上我們依然得到了8組用戶。
用戶分類采取不同的運營決策識別有價值的用戶
用戶分類距今間隔消費頻率(F消費金額(M) 重要價值用戶 1 1 1 對這部分優質客戶要特殊保護 重要發展用戶 1 0 1 忠誠度不高,很有潛力的用戶,需要對其識別后進行個性化推薦,增加用戶付費次數,提高粘性 重要保持用戶 0 1 1 說明這是個一段時間沒來的忠誠客戶,需要運營/業務人員對其進行喚回(可用紅包、獎勵、優惠券等方式) 重要挽留用戶 0 0 1 可能是我們的潛在客戶或易流失客戶,可以找到該部分用戶讓其給出反饋建議等 一般價值用戶 1 1 0 可能是對價格較敏感或付費能力不足,可對該部分用戶進行商品關聯推薦 一般發展用戶 1 0 0 新客戶,可對該部分用戶增加關懷,推送優惠信息,增加粘性 一般保持用戶 0 1 0 該部分客戶可能快要流失,可低成本營銷 一般挽留用戶 0 0 0 有可能不是目標客戶,若經費有限可忽略此類用戶 -
計算
-
設定標準
-
打分
-
計算均值
-
分類
TGI指數
-
定義
每一種用戶形態組合,對應一個結果。TGI指數反映目標群體在特定研究范圍(如地理區域、人口統計領域、媒體受眾、產品消費者]內的強勢或弱勢的指數。
-
計算
TGI指數=用戶分類中具有某一特征的群體所占比例/總體中具有相同特征的群體所占比例*100
-
用法
-
將目標用戶進行分類,
-
對比各類用戶與總體之間的差異性
要論證一種形態組合比另一種更好,要么做標桿對比:每個組合的收入;要么看時間線上,每個組合對應的利潤、成本等指標變化。比如在分析用戶的年齡段時,可以通過TGI指數對比各用戶分類與總體在各年齡段的差異,設用戶分類1中16-25歲的用戶占比為4%,而總體中16-25歲的用戶占比為8.3%,那么用戶分類1在16-25歲用戶中的TGI指數為4%/8.3%=48。依照這一方法,我們可以對各類用戶在各年齡段的TGI指數進行對比。如上圖所示,各類目標用戶在16-25歲這個年齡段的占比都比總體小(TGI指數<100),其中分類1的用戶年齡偏大,因為該類用戶在36歲以上各個年齡段的TGI指數都明顯高于100,且同時高于其他三類用戶。
-
TGI指數等于100表示平均水平,高于100,代表該類用戶對某類問題的關注程度高于整體水平
其他:
(LTV):客戶終生價值
用戶體驗模型:HEART
商品分析
-
定義:
產品,解決一系列問題的工具。商品,具體的交易物。商品分析主要指:商品,負責商品規劃,涉及:需求預測、供應鏈管理。量、收、利、進、銷、存:零售行業,無論線上線下都是這六個關鍵指標:總量、收入、利潤、采購(進)、存貨。和AARRR一樣,有一堆二級三級小指標。
杜邦分析法
起源于財務領域,擴展很多。通過數學公式和維度選擇,層層拆解,能夠用于初步定位問題所在。
ABC 分類法
ABC 分類法 (Activity Based Classification) ,全稱應為 ABC 分類庫存控制法。又稱帕累托分析法,28法則。
場景分析(產品)
-
產品介紹
-
核心目標
解決目標用戶市場一個什么問題,這個問題分析的越透徹,產品核心目標越準確。如:360安全衛士解決用戶使用電腦的安全問題。
-
產品定位
目標用戶群是誰?目標用戶群分析的越透徹,越清晰,對于后期產品推廣起關鍵性助推作用。一句話,比如,陌陌一款基于地理位置的移動社交工具。鳥哥筆記:分享互聯網產品,運營推廣干貨。
-
產品設計
功能、技術、可用性
-
重心
1.使用廣度:總用戶數,月活;
2.使用深度:每人每天平均瀏覽次數,平均訪問時長;
3.使用粘性:人均使用天數;
4.綜合指標:月訪問時長=月活人均使用天數每人每天平均瀏覽次數*平均訪問時長
在產品初期,核心的工作是拉新,應該更加關注產品的使用廣度,而產品的中后期,應該更加注重使用深度和使用粘性的提升。
-
對于不同的產品也需根據產品的性質來確定核心指標,比如,對于社交類產品,使用廣度和使用粘性至關重要,而對于一些中臺分析類產品,提升使用深度和使用粘性更有意義。
工具類:啟動次數很重要
社區類:活躍用戶和UGC(User Generated Content)用戶原創內容”很重要
游戲:在線人數和ARPU值是關鍵
移動電商:主要關注成交銷售額。包括訂單轉化率和金額轉化率
-
-
轉化漏斗
漏斗模型,常用來改善內容投放、新用戶注冊、產品流程。這些工作往往是若干環節組合,用戶在操作過程中會因為環節太多而流失,類似漏斗的效果,所以有漏斗模型的說法。
根據流程,分析析每個環節的:轉化量,轉化率、停留時長,訪問深度。通過標桿/同比、環比的比較判斷好壞。考慮到設計產品的用戶行為路徑,其中詳情頁的轉化率是最為重要的指標。
-
購買轉換率:訪客中購買商品的比例,購買客戶數/訪客數
-
詳情頁到達率:詳情頁UV/曝光率
詳情頁的主要來源:入站UV——直接落地詳情頁、入站UV——聚合頁(從首頁進入、從頻道進入、從分類頁進入、從品牌頁進入)、入站UV——商品詳情頁(關聯銷售)——詳情頁,分析聚合頁進入
-
詳情頁下單轉化率:
詳情頁缺少吸引力
-
支付成功率
支付引導差/支付工具問題
場景分析(營銷)
可以粗略的理解為:用戶的消費場景的搭建。重在提高用戶的體驗,對各場景進行優化,增強客戶粘性。沒有創造牛x的運營策略,只是因為發現了用戶在xx場景下的xx需求,通過我們設定的路徑和工具,幫助用戶實現了而已。
-
渠道來源:
referral-引薦網站:指向本網站的其他網站
direct-直接進入:直接輸入網站或者通過收藏夾進入,一般是老客戶
organic sercch-自然搜索、other-一般付費流量
paid search 付費搜索
-
場景:
- 線上場景: APP/網站內部的消費場景:頁面項目,內部檢索,專題頁面,站內廣告,
- 線下場景:各城市分布,各門店銷售。
渠道分析
-
用戶轉化率—導入用戶數 平面坐標
優質渠道 、潛力渠道、垃圾渠道、混雜渠道
-
轉化率分析:漏斗模型
-
辨別渠道作弊
-
渠道效果評估:留存率
-
用戶終端
1、方法:關注低價設備排名
2、方法:關注新版本的操作系統的占比
3、關注wifi網絡的使用情況
4、定向投放也很重要
-
用戶行為
1、比較用戶行為數據
2、了解新增用戶、活躍用戶小時時間點數據曲線
3、查看用戶訪問的頁面明細細
-
轉化率分析
-
反作弊模塊
(1)設備號異常:頻繁重置idfa
(2)ip異常:頻繁更換地理位置
(3)行為異常:大量購買特價商品等
(4)數據包不完整:只有啟動信息,不具備頁面、事件等其他用戶行為信息
-
十一、數據可視化 visualization
-
類別
靜態圖表
動態交互圖形
-
制作方式
自動圖表化
手動圖表化
-
流程
-
確定主題
-
匯總數據
-
分析數據格式
-
探索表達方式
根據數據類型和業務目的選擇
-
創意草圖
-
編輯
-
設計
-
檢驗
常用圖形
復雜圖是簡單圖形的組合,最基礎:條形圖、餅圖、柱狀圖
-
比較:對比
-
條形圖
顯示Y軸各個項目之間的比較情況
-
柱形圖
通常描述的是分類數據,用于顯示一段時間內的數據變化或顯示各項之間的比較情況。
-
雷達圖
當系列值多于兩個的時候,再用柱形圖會使柱形圖顯得擁擠,這個時候我們可以選擇雷達圖
-
目標完成率圖
-
-
聯系:查看兩個變量之間關系
氣泡圖
雙坐標軸圖
-
旋風圖
- 作用
用于兩個項目不同指標或者不同系列的對比,另外一個作用就是表示兩個數據之間的相關關系
步驟:
選中數據 → 插入簇狀條形圖 → 右擊數據條選中設置數據系列格式 → 把主次坐標軸數字大小調成一樣 → 選中一個標簽然后逆序 → 最后設置坐標軸格式去掉負數
-
構成:組成要素,每個部分所占整體的百分比
-
餅圖:
餅圖以二維或三維格式顯示每一數值相對于總數值的大小
樹形圖、排列圖 、
-
漏斗圖:
漏斗圖主要是在條形圖的基礎上繪制,主要使用的是堆積條形圖。
適用于業務流程比較規范、周期長、環節多的單流程單向分析,通過漏斗各環節業務數據的比較,能夠直觀地發現和說明問題所在,為決策者提供一定的參考。
分布:關心各數值范圍包含多少項目,如
柱形圖
-
盒式圖:數據基礎中有
-
散點圖
顯示變量之間的相互影響程度,點的位置由變量的數值決定。
-
帕累托圖
排列圖,主次圖、主要用于質量分析原因定位等.原則就是二八原則
-
直方圖
高代表數據密集 ,低代表數據較少
直方圖畫法: X——max-min均勻區間;Y——頻數
-
地圖,甘特圖
看趨勢
- 折線圖:
面積圖:又叫區域圖,面積圖強調數量隨時間而變化的程度, 它是在折線圖的基礎之上形成的, 它將折線圖中折線與自變量坐標軸之間的區域使用顏色或者紋理填充,顏色的填充可以更好的突出趨勢信息
-
迷你圖
最大化數據墨水比原則:保留有效元素,去除無效元素,淡化非主要元素
十二、常見指標
注意時間維度
1. 用戶指標
-
規模數量
-
流量
訪問量/啟動次數:會話session次數,用戶打開第一個網頁之后啟動一次會話,編號為sessionID=X,用戶30min內無操作或者關閉網頁,會話結束,計為一次會話;
UV:(unique visitor)一定時間獨立訪客數:在網站系統中會依據用戶的瀏覽器、設備編號等為用戶分配一個編號,這個編號被稱為Cookie,訪客數就是COOKie數,更換瀏覽器或者設備cookie會變;
PV:(Page View) 頁面瀏覽次數 -
用戶數
用戶數、
新客用戶數:表示網站客戶規模的增長速度;
產品每天新增的用戶數
老客用戶數、新/老用戶數量比
-
召回
召回 召回數 召回率
-
-
質量
-
用戶活躍
AU()活躍用戶數:一段時間內啟動過應用的設備數,表示用戶的規模
DAU(Daily Active User)日活躍用戶數量:日活躍用戶數波動較大一般用作當天的引流效果。通過DAU可以很直觀的了解產品的所處在的生命周期。
MAU(即monthly active users):月活躍用戶數量相對穩定,用來表示活躍用戶數
活躍系數:?流失用戶:是指連續n周沒有啟動過應用的應用
忠誠用戶:連續活躍n周以上的用戶
-
意向
詢單量
詢單轉化率
平均接待時長
店鋪評分 -
轉化率
轉化:最重要的。根據具體情況定義,任何有意義的動作都可以是轉化。達成某種目標的訪客數(訪問量)/總的訪客數(訪問量),采用訪問量量意味著每次訪問都是下單或者購買的機會,訪客數意味著購買之前多次訪問是正常的。
訂單轉化率
來源轉化率
注冊轉化率
行為完成率
-
留存
n日留存計算:使用粘性。 統計日期內新增的用戶或活躍用戶,在第N天又來使用的比例,可以參考行業值對標自己的應用留存是否健康;不同維度下用戶流失的情況 閱讀資訊、社交溝通、系統工具是留存率最高的三類應用,在4個月以后的留存率穩定在10%左右。
次日留存率:新手引導設計和新用戶轉化路徑
7日留存率:在這個時間段里,用戶通常會經歷一個完整的使用和體驗周期,如果在這個階段用戶能夠留下來,就有可能成為忠誠用戶
30日留存率:APP版本更新是否對用戶有影響 通常移動APP的迭代周期為2-4周一個版本,
渠道留存:渠道不同用戶質量也會有差別,而且排除用戶渠道差別的因素以后,再去比較次日,周留存,可以更準確的判斷產品上的問題
-
消費
APA(Active Payment Account)活躍付費賬戶
ARPU (Average Revenue Per User)即客單價=總收入/總用戶數 =銷量*單價/總用戶數=人均購買的件數*件單價**。付費能力
ARRPU:(付費用戶人均付費) 總收入/付費用戶數
UP付費率:付費用戶/總用戶數 ,區別對待付費用戶和免費用戶,兩者行為差別很大,單獨跟蹤和對待付費用戶的行為流失,服務好付費用戶提升金額就可以提升交易額
購買次數
復購率:消費N次以上的人數/付費用戶,代表電商的用戶粘性
首次付費時間:用戶激活多久后才會開始付費,有助于把握轉化用戶的時間節點適合的時間嘗試引導付費客單價
新用戶客單價:和新用戶的留存有很大關系;
連帶率 :人均購買件數,是指每個客戶購買了幾件商品,這個指標常用來衡量關聯銷售的效果——(組合裝/單價裝、推薦效果——推薦帶來的銷售額)LTV::用戶生命周期總價值
-
傳播
轉發率
邀請率
-
UGC
發表文章、點贊、評論、閱讀、訂閱、
熱度:熱度=分享次數+推薦次數+點贊次數。
-
2.商品指標
量、收、利、進、銷、存:總量、收入、利潤、采購(進)、存貨。
-
品類
品類結構:男、女、童裝
銷量結構:爆旺平滯
尺碼結構:XS、S、M、XL,XXL,
季節款:
風格款:
時間:上架天數/可售天數
商品層次:備貨款、新款、淘汰款、
-
量
總量
sku數
銷量:歷史銷量、預測銷量;總體、品類;
訂單量:訂單數(關系到支付壓力和倉庫發貨的任務量)
售罄率
斷碼率:**重點商品的缺貨率(爆款缺貨的比例)**造成客戶流失的重要指標
加貨次數
增長率(歷史增長/平臺增長)
-
收入
GMV( Gross Merchandise Volume,網站成交金額):GMV=實際成交額+取消訂單金額+拒收訂單金額+退貨訂單金額。體現電商平臺的交易規模
實際成交額/GMV:購買意向
凈銷售額(不含退貨):凈銷售額是統計期間內的銷售業績減去期間退貨的業績
銷售結構(品類/價格帶/折扣帶)
業績增長率
-
利潤
件單價:熱銷商品的價格波動
毛利:總體、單體;品類
價格帶
折扣
-
采購(供應鏈)
-
供應商:響應周期
-
庫存
總量
周轉率
庫存金額(成本/ 吊牌)
有效庫存比(適銷)
庫存結構 (年份/品類/價格帶)
存銷比
斷碼率
斷貨率
品類占比
貨齡(存貨天數)
各商品層次SKU數
備貨SKU數 -
制造商
貨期
時效
產能
超期率 -
倉儲配送
送貨時間
妥投及時率:(妥投到客戶的訂單中,安裝約定時間妥投的比例),重要的客戶體驗指標,影響客戶的回購率;
-
-
評價
退貨率(整體/單款)
3.產品指標
-
使用廣度
總用戶數,月活;
-
用戶活躍
AU()活躍用戶數:一段時間內啟動過應用的設備數,表示用戶的規模
DAU(Daily Active User)日活躍用戶數量:日活躍用戶數波動較大一般用作當天的引流效果,
MAU(即monthly active users):月活躍用戶數量相對穩定,用來表示活躍用戶數
活躍系數:? -
功能使用率:使用某功能的用戶占活躍用戶數的比例,用來表示某個功能的受歡迎的程度
-
-
使用深度
人每天平均瀏覽次數,平均訪問時長;
-
瀏覽深度
Tp(Time on Page)停留時長
PV(page view )瀏覽的頁面數量:頁面停留時長和網站停留時長,平均值,在此頁面(站)的總停留時長/此頁面(站)總的訪問量;
PV/UV:
日平均使用時長: 用戶使用APP或網站/頁面的總時長=總時長/總用戶數
軌跡:訪問的頁面明細
跳出率:非常重要,指的是來到網站后沒有任何操作就離開的比例,落地頁的訪問量/總的訪問量
頁面點擊:頁面熱點圖**
退出率:衡量某個網站推出的概率,無論從哪里進入最終從這里退出的比例,從一個頁面退出的次數/訪問次數
-
-
使用粘性:
人均使用天數;
每次啟動活躍時長
訪問間隔
時間點數據曲線
-
用戶終端
設備價格
操作系統
wifi使用情況
ip分布
-
綜合指標:月訪問時長=月活人均使用天數每人每天平均瀏覽次數*平均訪問時長。
導出率:點擊該頁面上鏈接的次數除以進入該頁面的次數
商品導出率:在該頁面上點擊商品詳情頁的次數除以進入該頁面的次數,
推薦商品點擊率:點擊推薦商品的比例/在商品詳情頁看到推薦的訪客。
4.營銷指標
需要時刻保持對于ROI的關注,保證運營活動的必要性和有效性。
運營完成后,需及時復盤,查看最終結果與預期目標的差距、投入產出的最終比例,以及運營前后數據的變化等。通過復盤,提升運營活動質量的持續性
-
流量來源
-
獲客成本:
CAC(用戶獲取成本)
CPC(每次點擊付費)
CPT(按時長付費)
CPM(千人成本) 、
CPS(按提成收費)
-
同 用戶留存指標
-
同 產品轉化指標
十三 工具偏
1. 網站分析工具
-
百度統計
-
GoogleAnalytics:
-
對比
百度統計GoogleAnalytics: 如果做二次開發(埋點):可以統計訂單交易數據、用戶點擊、注冊、下載等動作(事件) 百度:國內用的最多的免費網站流量統計工具,速度快 GA:GoogleAnalytics,國外用的最多的免費網站流量統計工具,功能豐富 http://www.google.com/analytics/ 適合: 流量統計輔助工具 貿類型的網站,服務器架設在國外,用戶主要是國外用戶 費用: 免費,數據準確, 基礎版本免費(據說數據量太大千萬以上就不正確) 用處: 學習其分析方法和原理,面試的時候要求會。工作中用的比較多,因為百度的市場份額大通過百度SEO訪問來源的用戶精準 學習其分析方法和原理,面試的時候要求會,不過基本不用 國內訪問不了,需要掛VPN。國外的數據經常有差錯,會丟包!準確率70%左右。 部署人員: 分析師+(WEB開發工程師) 分析師+WEB開發工程師 缺點: 提供的數據不夠全面,不過基本夠用 國內用戶少,不能和推廣工具直接對接。 優點: 免費,可以很好地和百度推廣賬號打通。 功能強大 類型工具: CNZZ、騰訊統計 原理 通過一段js代碼,獲取訪客行為和頁面的信息, 分析方法 統計渠道推廣ROI 估計百度推廣渠道的轉化效果 統計訂單數據 統計網站流量和用戶行為細節數據 統計關鍵的事件(咨詢、下載、點擊) 案例http://coric.top/zh/h2h 數據https://tongji.baidu.com/web/demo/visit/district?siteId=5503017
2.移動端分析工具
國外——flurry、Google Analytics;國外——友盟、TalkingData;Crash分析工具——crashlytics
番外篇:基本素養
自上而下設計,自下而上回歸,這種層層遞進的邏輯方法,也是數據分析的短板。從經驗上看,數據分析師做的方案往往傾向于保守,往往缺少創意,這些都是太過理性的后遺癥。而實際上商業成功往往不是理性的結果。天才的創意、勇猛的膽識、無敵的運氣、過人的機智、誘人的魅力、不可挑戰的權力,可能都是成功的因素。
然而,數據分析的獨特吸引力也在這里。你會發現創意、機智、魅力是天生的,權力、運氣可遇不可求的,膽識加在蠢人身上就是災難。唯獨數據分析能力是可以通過學習、訓練、實驗、記錄來不斷提升的。所以基于數據提可行性建議,可能不會被采納,但只會越來越被重視。經濟大潮來了,怎么都能成功,現在水勢不明的時候,就是數據方法大放異彩了
醫者意識
需求如患者,分析如醫者。需要理論扎實,也需要觀察到位,溝通到位,要對癥下藥,實事求是,還需要循序漸進,認識任何數據產品都不是靈丹妙藥。
指標意識
如同醫生通過體溫、儀器測試推斷病情,除了多維度獲取信息外還需要知道正常值的范圍。
1. 取數和分析的基本區別:是否使用了數據指標來描述問題。
2. 判斷標準一定要事先立!太多項目死于“提高銷量”“增加活躍度”這種含糊的標準到底提高多少!增加多少,事前要有判斷。
3. 數據指標需要得到需求方的驗證
業務意識
數據作為一個產品,和所有的產品一樣,想助力業務,要有用戶,場景,痛點。場景拆分的越細,越能夠擊中用戶痛點,所以得從基礎一線業務認真研究起,分析要結合業務動作。
- 細節優于大招
實際業務是由許許多多個環節構成的,業務上有多個控制點能陽止問題發生,并且控制點數據需求是不同的,所以可以分場景,做細致的分析。
這也是為啥不推薦憋超牛逼模型的原因。大部分業務流程中,人為干預點極多,最后業務做不好,很有可能就是單純因為人蠢、壞,所以賭一個模型能預測所有,非非常危險
- 實用意識
在實際工作一定要牢記這點遇到事先問三問: 1. 數據足不足夠 2. 時間允不允許3. 業務買不買單。- 尊重數據,尊重數據落地的規律,尊重每一種數據產出形式。
不要覺得我有個“數據XX的頭銜”,就得看各種高深的算法理論才算有用。搞理論是科學家的事,在企業上班就得干點實際有用的東西。要因地制宜選擇方法。在企業中,不是方法越難越有價值,而是越能幫助到業務才越有價值。同樣效果前提下,方法越簡單越好。因此真正做工作的時候,往往是在時間、數據、業務需求限制下,選擇最短平快的方法。至于復雜的方法,可以在工作有余力的時候自己嘗試。想探索數學的奧秘,可以去讀個博士做科研。在企業做數據分析是為了助力業務,并不是自己嗨。 - 不要單純的為了搞指標而搞指標。
這和工作習慣有直接系。很多同學不是試圖自己去理解業務流程、業務目標,而是去找一個“權威”“正式”“完美”“通用”版的指標體系。結果就是只會到處抄抄抄,看似做了很多,結果連看數據的人都沒幾個。
- 尊重數據,尊重數據落地的規律,尊重每一種數據產出形式。
溝通意識
- 不做溝通:不管業務目前啥水平,自己干自己的。項目配合不暢,總被批不懂業務
- 做溝通但沒有檢驗:誤以為業務很“數據思維”,結果才發現這幫人只是披著數據外衣的經驗主義!
- 有檢驗但盲目自大:做數據的,自己看不起報表,覺得報表太簡單,非要憋一個超牛逼模型出來,一模定乾坤。項目工期太久,業務等得不耐煩
- 有檢驗、不自大,但太過糾結:總怕做錯,溝通頻率太低,自己糾結細節,進度磨磨唧唧。項目期望值太高,最后一地雞毛
工程思維
與直覺思維不同,工程思維是數學、工程工具、邏輯去尋找答案,解決問題的一種思維方式。做數據分析,感性是用于溝通流的,核心是理性。用邏輯性對抗情緒化,我們些感覺、情緒、沖動都是我們的大敵,要堅決消滅!
脫離概率談個案、脫離整體談細節、脫離數據談現狀、脫離標準談判斷,統統都是耍流氓!
1+1/2+1/4+1/8+ 1/16.……,不斷加下去會是無窮大嗎?有 人覺得會,因為加的數字是無窮無盡 的。其實,在數學上可以嚴格地證明即 便無限加下去,總和也不會超過2。1+1/2+1/3+1/4 + 1/5……,不斷加下去會有極限么?如果 你按照上一個問題的思路來考慮這個問 題,得到的結論應該是有一個極限,因 為也是越加越小,加的數字趨近于零。 如果你是這么想的,我不得不告訴你, 非常遺憾,你猜錯了,這個序列加下去 |還真是無窮大。
超模板意識
醫學教科書上的描述代表大多數患者的共性,而醫生要解決的是眼前這個病人的問題,而病人的病情資料永遠都不會完整,病癥表現的存在多樣性,病情存在的個體差異性。在企業里數據分析也是同樣的處境,從來就沒有
實際需求都是一個模板,一個數據集,一個范例解決不了的。優秀的數據分析師,腦子里裝的是一個個具體的業務問題,然后拿數據解釋問題,從問題中發現新數據。流水線上工人,才是對著模板擰螺絲,每一個操作都一模一樣。引以為戒。
接地氣學堂 ??
我家門前的大樹年年都在長,中國GDP也年年在漲,兩列數據算個相關系數哇塞0.99,P值小于0.05,所以我家門前的樹是我中華龍脈,我要發財啦! ??
理想的病人:現實中能一見到醫生,能清晰的說出:“自己從27號開始發燒,已經持續到今天,期間體溫沒下過38度,27號淋了雨,沒有其他癥狀,沒有喉嚨痛”——這樣理性、清晰的病人少之又少。真實的病人:總是一進門只會哼哼:誒呦,誒呦,誒呦,醫生啊,我渾身難受啊,快救救我啊!醫生問:到底哪難受?病人:全身難受……這時候咋辦?醫生只能從0開始溝
問家屬:“到底他哪里不舒服?”
查病歷:“之前有什么病史?”
做檢測:“測個體溫/驗個血/拍個片看看?”
問行為:“吃了什么?去了哪里?”
做測試:“我按你這里,會不會更疼?
專業的醫生,不但只談病情,連醫保政策、家庭收入、親子關系都會很耐心的和病人溝通。這些因素跟病情沒有關系,但跟病人看病花的錢、時間、精力有直接關系。最后都會影響看病效果。 ??
高層管理往往很希望推動數字化轉型、信息化建設等,我們大搞BI系統,數據建模,數倉建設,下邊的人也會吐槽無用。 ??
不配合的病人。
總結
- 上一篇: Nginx源码目录介绍
- 下一篇: SwiftyJSON 对网络请求来的数据