Python数据分析报告
業(yè)務(wù)背景:B2B業(yè)務(wù)已收會員和服務(wù)費作為收益主要來源,目前會員類型分成鉆石會員、金牌會員,銷售合同一般會包含會員服務(wù)、增值服務(wù)、廣告服務(wù)等等,銷售過程可能會受到銷售策略的影響,做一些業(yè)務(wù)的促銷優(yōu)惠或者折扣。每年的訂單含新客戶簽約和老客戶續(xù)約兩種,同時合同期間也會出現(xiàn)服務(wù)加購或者變更的問題。
問題研究:自今年以來整體收益有明顯提升,高級會員量也持續(xù)增加,鉆石會員量相比去年同期也翻倍上漲,鉆石會員回款額也在持續(xù)上升,鉆石會員的金額遠(yuǎn)高于金牌會員,但整體均單額卻相比去年同期沒有顯著增長,請根據(jù)所提供數(shù)據(jù)分析具體原因,并給出分析過程。
編程語言:Python
IDE:Jupyter Notebook
注:這是我之前校招參加XX科技公司的數(shù)據(jù)分析筆試題,分享一下自己的做題經(jīng)歷,如果需要代碼的后臺私聊我哈
數(shù)據(jù)分析報告
一、數(shù)據(jù)清洗
1、異常值 篩選出合同簽訂日期大于當(dāng)前日期(2020-09-16)的異常數(shù)據(jù),如圖
這些數(shù)據(jù)我認(rèn)為屬于異常數(shù)據(jù),將他們剔除,同時對于數(shù)據(jù)中的合同狀態(tài),我在 本次分析過程中只保留了合同狀態(tài)為正式合同的數(shù)據(jù),剔除合同狀態(tài)為作廢、草擬、待審核、審核未通過、客戶待確認(rèn)等數(shù)據(jù),因此過濾得到 45783 樣本數(shù)據(jù);
2、缺失字段
經(jīng)過檢驗,含有大量缺失數(shù)據(jù)(缺失比例超過 30%)的字段如圖所示,由于 有的字段缺失是因為業(yè)務(wù)原因,屬于正常情況,如會員產(chǎn)品開始日期、結(jié)束日期、 服務(wù)日期等,所以對于這種字段缺失問題無需處理,同時對于其他缺失比例較大 的字段,由于在本次的分析過程并未使用,因此這里就不做處理。對于缺失比例 較小的字段則可以采用眾數(shù)填充
二、驗證數(shù)據(jù)正確性
此處略
三、異常原因分析
1、分析結(jié)構(gòu)
1.1、用戶群體對比分析
上面三幅圖表明 2020 年新老用戶數(shù)量均要高于 2019 年,表明公司的拉新和 留存做的比較好;
從這三幅圖中,可以發(fā)現(xiàn) 2020 年新簽、續(xù)約以及加購類型均要高于 2019 年, 尤其是加購類型,2020 年加購類型的數(shù)量要遠(yuǎn)遠(yuǎn)高于 2019 年,這表明 2020 年 有一大部分客戶對于會員產(chǎn)品都持有觀望謹(jǐn)慎的態(tài)度,尤其是對于新客戶而言, 他們中大多數(shù)可能是被折扣和優(yōu)惠金額所吸引,因而他們大都不敢購買會員產(chǎn)品, 因而存在會員產(chǎn)品購買轉(zhuǎn)化率低的問題。而加購合同的平均金額是要低于續(xù)約合 同的平均金額的,這應(yīng)該是 2020 年合同的單均額較去年沒有顯著上漲的原因之 一;
1.2、變更客戶類型分析:
對比上面兩幅圖,說明相比于 2019 年,2020 年加購合同的變更率更高,而 續(xù)約合同的變更率更低,意味著客戶對我們的會員產(chǎn)品的滿意度在降低,高價值 合同(購買會員產(chǎn)品)客戶在流失!
1.3、客戶合同類型分析:
根據(jù)這兩幅圖,說明對于新簽合同下,2020 年的新用戶比 2019 年新用戶有 所增加,由于這部分新用戶的增加,很大程度是被巨大的優(yōu)惠政策和折扣吸引過 來,那因為這部分新用戶的加入,總金額會增長,但是單均額就未必會增長,需要近一步觀察用戶轉(zhuǎn)化情況,如下圖
可從這兩幅圖對比發(fā)現(xiàn),2020 年在選擇加購合同下的老用戶的人數(shù)遠(yuǎn)遠(yuǎn)超過 2019 年的人數(shù),具體表現(xiàn)在老客戶更多的是選擇了沒有會員產(chǎn)品的或者是會員 產(chǎn)品小于 12 個月的,即這部分客戶對我們的會員產(chǎn)品質(zhì)量、服務(wù)等方面持有觀 望態(tài)度,說明公司的會員產(chǎn)品購買的轉(zhuǎn)化率較低;
對比上面三幅圖,可以明顯發(fā)現(xiàn)對于 2020 年,新客戶的折扣金額要遠(yuǎn)遠(yuǎn)超 過 2019 年的折扣金額,這就解釋了為什么 2020 年新客戶的數(shù)量較去年顯著增 加,但是對于這部分的新客戶的單均額卻沒有顯著增長,因為這部分新客戶大都 被巨大的折扣優(yōu)惠所吸引;同時加購類型用戶也是所有類型客戶中折扣金額最低 的客戶群;這意味著我們著重關(guān)注了新老客戶的購買優(yōu)惠,而對于這種中間類型 的客戶也是需要給予適當(dāng)?shù)膬?yōu)惠,以提高他們對會員產(chǎn)品的購買意愿;
1.4、時間角度分析:
從時間維度來看,發(fā)現(xiàn)在每年的 6 月合同的實際收款金額都會呈現(xiàn)驟降的現(xiàn) 象,而且在 2019 年 12 月的時候也是發(fā)生了合同實際收款金額驟降的問題;由于 當(dāng)前數(shù)據(jù)時間跨度較短以及涉及的業(yè)務(wù)知識有限,無法確定這是否是一個正常的 周期現(xiàn)象,不過對于這種驟然下跌,需要和運(yùn)營溝通,進(jìn)一步的分析原因找出潛在的問題。
2、指標(biāo)拆解:
單均額=∑合同總額/有效合同個數(shù)=∑(合同總價?優(yōu)惠券抵扣金額?折扣金額)/正式合同個數(shù)
從上面兩幅圖可以看出,盡管2020年的合同總額要超過2019年,但是2020 年的合同的個數(shù)確實要遠(yuǎn)遠(yuǎn)高于 2019 年的,這說明 2020 年存在很多不包含會 員產(chǎn)品的合同,而這些合同他們的金額一般比較低,因此隨著合同數(shù)量上升了, 即總金額上升了,但是單均額卻有所下降;
這幅圖也是驗證了我們剛才的想法,盡管 2020 年的正式合同的數(shù)量增多, 但是大部分的正式合同都不包含會員產(chǎn)品,意味著客戶對我們提供的會員產(chǎn)品的服務(wù)/質(zhì)量不是很滿意;
3.原因分析:
由于篇幅原因,此部分省略
四、結(jié)論:
看到這么的分析,想必大家對結(jié)論應(yīng)該很清晰了吧,大家可以嘗試自己總結(jié)一下看看~
代碼截圖:
由于分析代碼太長,這里放不下,需要的話,可以后臺私戳我~
如果覺得這篇分析報告有用的話,歡迎大家點贊+收藏,如果有其他需求的話,也可以后臺私戳我,我看到會回復(fù)大家的!
【未經(jīng)本人許可,禁止轉(zhuǎn)載】
總結(jié)
以上是生活随笔為你收集整理的Python数据分析报告的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python-day8-赋值
- 下一篇: 关于level_idc和Profile_