数据分析如何入门,以及如何做职业规划?
0 如何定義“入門”?
1 什么是數(shù)據(jù)分析
簡單來說,數(shù)據(jù)分析就是利用數(shù)據(jù)來理性思考和決策的過程。
現(xiàn)在各行各業(yè)的公司都在使用量化的數(shù)據(jù)來表示本行業(yè)以及本公司的各項業(yè)務(wù),并且企業(yè)的決策都需要大量的數(shù)據(jù)作為支撐依據(jù),特別是互聯(lián)網(wǎng)企業(yè),而數(shù)據(jù)分析師,指的就是專門從事行業(yè)數(shù)據(jù)搜集、整理、分析,并依據(jù)數(shù)據(jù)做出行業(yè)研究、評估和預(yù)測的專業(yè)人員。
在實際的工作崗位中,數(shù)據(jù)分析師其實可以分為兩種:一種類似產(chǎn)品經(jīng)理、一種偏向數(shù)據(jù)挖掘,類似產(chǎn)品經(jīng)理方向更加注重業(yè)務(wù),對業(yè)務(wù)能力要求比較高;數(shù)據(jù)挖掘方向更加注重技術(shù),對算法代碼能力要求比較高。
但在求職方面,特別是對于希望向數(shù)據(jù)分析方向進(jìn)行發(fā)展的學(xué)生,最好在技術(shù)和業(yè)務(wù)兩方面都要有所了解。
有興趣入門數(shù)據(jù)分析的小伙伴們,我在這里推薦幾門課程:
Coursera 里約翰霍普金斯大學(xué)推出的數(shù)據(jù)科學(xué)專項課程
這門課程偏向數(shù)學(xué)基礎(chǔ)、統(tǒng)計學(xué)理論和算法等等,非常適合想要走偏向數(shù)據(jù)科學(xué)路線的同學(xué),課程里包含了R語言程序設(shè)計、探索性數(shù)據(jù)分析,統(tǒng)計推斷、回歸分析以及實用的機(jī)器學(xué)習(xí)算法等等,對于新手而言非常友好。
貪心科技聯(lián)合騰訊課堂共同推出的《商業(yè)數(shù)據(jù)分析課程》
在這項課程里你能深入學(xué)習(xí)到一名數(shù)據(jù)分析師所需要的各項技能,并充分接觸到真實場景中的數(shù)據(jù),了解到真實的業(yè)務(wù)背景和商業(yè)需求,對于學(xué)生而言是學(xué)習(xí)數(shù)據(jù)分析技能和接觸業(yè)務(wù)的寶貴機(jī)會。
2 數(shù)據(jù)分析工具:欲善其事先利其器
最常見,在工作中也最常用的數(shù)據(jù)分析工具就是EXCEL和Python,對于貼近數(shù)據(jù)庫、貼近工程向的數(shù)據(jù)分析師還會用到MySQL。
在貪心學(xué)院的商業(yè)數(shù)據(jù)分析課程中,涉及到了數(shù)據(jù)分析師需要掌握的幾乎所有軟件工具,包括基礎(chǔ)而全面的EXCEL和靈活強(qiáng)大的Python,并會學(xué)習(xí)專門的Pandas庫來進(jìn)行數(shù)據(jù)表的集中操作,NumPy進(jìn)行各類數(shù)學(xué)運(yùn)算,Matplotlib、Pyecharts進(jìn)行數(shù)據(jù)可視化,SQL進(jìn)行數(shù)據(jù)的存儲、提取、分類等等,并且會學(xué)到專門的數(shù)據(jù)可視化工具,包括在企業(yè)中常用的PowerBI和Tableau等等。
掌握這些數(shù)據(jù)分析工具能快速帶領(lǐng)你進(jìn)入數(shù)據(jù)分析的大門,提升你對數(shù)據(jù)分析師這個職位的整體理解,也為后面的理論學(xué)習(xí)、業(yè)務(wù)分析打下了堅實的基礎(chǔ)。
3 建模分析:像數(shù)據(jù)分析師一樣思考
在掌握了各項數(shù)據(jù)分析的工具之后,就要學(xué)習(xí)常見的數(shù)據(jù)分析和建模方法,
數(shù)據(jù)整體分布是怎樣的?什么是總體和樣本?中位數(shù)、眾數(shù)、均值、方差等基本的統(tǒng)計量如何應(yīng)用?如果有時間維度的話隨著時間的變化是怎樣的?如何在不同的場景中做假設(shè)檢驗?數(shù)據(jù)分析方法大多源于統(tǒng)計學(xué)的概念,所以統(tǒng)計學(xué)的知識也是必不可少的。需要掌握的知識點(diǎn)如下:
基本統(tǒng)計量:均值、中位數(shù)、眾數(shù)、百分位數(shù)、極值等
其他描述性統(tǒng)計量:偏度、方差、標(biāo)建 顯著性等
其他統(tǒng)計知識:總體和樣本、參數(shù)和統(tǒng)計量、ErrorBar
概率分布與假設(shè)檢驗:各種分布、假設(shè)檢驗流程
其他概率論知識:條件概率、貝葉斯等
在貪心學(xué)院的商業(yè)數(shù)據(jù)分析課程中,這些統(tǒng)計學(xué)知識都不是單純地、枯燥地來進(jìn)行講解和學(xué)習(xí),而是與實際業(yè)務(wù)和案例進(jìn)行深入結(jié)合,使用真實的企業(yè)數(shù)據(jù)來對統(tǒng)計學(xué)知識、數(shù)據(jù)分析理論來進(jìn)行學(xué)習(xí),例如
摩拜共享單車騎行時間分析案例。時間格式作為企業(yè)級數(shù)據(jù)分析項目中一定會遇到的一種格式,而時間的處理也成為了數(shù)據(jù)分析師不得不面對而又頭疼的一種數(shù)據(jù)格式。在這個項目中,貪心學(xué)院的老師會帶領(lǐng)各位同學(xué)對時間格式轉(zhuǎn)時間戳和時間戳轉(zhuǎn)時間格式以及時間的運(yùn)算進(jìn)行重點(diǎn)練習(xí)。在經(jīng)過此案例之后,你能收獲如下技能:掌握數(shù)據(jù)的基本運(yùn)算、統(tǒng)計方法、數(shù)據(jù)清洗方法,能夠獨(dú)立進(jìn)行空數(shù)據(jù)、重復(fù)數(shù)據(jù)等臟數(shù)據(jù)類型的清洗,能夠進(jìn)行各種時間類型的運(yùn)算。
4 業(yè)務(wù)思維:不做“工具人”
數(shù)據(jù)分析的所有工作、所有技術(shù)、所有方法和指標(biāo),都是為了指導(dǎo)業(yè)務(wù)、做出決策,因此,僅僅掌握理論和方法是遠(yuǎn)遠(yuǎn)不夠的,僅通過數(shù)學(xué)統(tǒng)計學(xué)知識并不能達(dá)成最終的結(jié)果,而且整體模型的建立、所有的技術(shù)指標(biāo)、以及整個分析處理直到可視化展示的流程,都要以真實的業(yè)務(wù)需求作為基礎(chǔ),脫離業(yè)務(wù)的數(shù)據(jù)沒有任何意義。
因此,貪心學(xué)院的的商業(yè)數(shù)據(jù)分析課程中,將業(yè)務(wù)理解放在了非常重要的位置,在商業(yè)數(shù)據(jù)分析課程中的幾乎所有內(nèi)容都是基于真實的數(shù)據(jù)與案例,并且有專門的案例分析與展示來提升你對業(yè)務(wù)的理解。
貪心學(xué)院的的商業(yè)數(shù)據(jù)分析課程一個重點(diǎn)就是業(yè)務(wù)能力的培養(yǎng),在老師帶領(lǐng)同學(xué)分享案例,分析業(yè)務(wù)的過程中,你將會學(xué)到企業(yè)中常用的業(yè)務(wù)分析模型,例如5W2H分析模型、AARRR分析模型、RFM客戶價值模型、A/B 測試模型、用戶分成模型、SWOT分析模型、購物籃分析模型、波士頓矩陣分析、生命周期模型、企業(yè)戰(zhàn)略模型等等,這些都會成為將來你求職和工作中的利器。
在商業(yè)數(shù)據(jù)分析課程中所使用的案例都是真實企業(yè)所面臨的業(yè)務(wù)問題,例如
嗶哩嗶哩主站廣告優(yōu)化分析項目
在這個項目中,同學(xué)們將研究嗶哩嗶哩平臺的廣告投放情況,如何針對有需求的人群進(jìn)行廣告投放涉及到需求匹配(用戶對商品感興趣)、購買力匹配(用戶買得起產(chǎn)品)兩個方面,因此如何通過用戶在平臺上的使用行為數(shù)據(jù)以及CPC廣告數(shù)據(jù)進(jìn)行分析和優(yōu)化成為了廣告投放的重點(diǎn)。通過這個項目,你能對互聯(lián)網(wǎng)CPC信息流廣告業(yè)務(wù)邏輯和落地細(xì)節(jié)有所掌握,理清廣告投放的數(shù)據(jù)分析思路和業(yè)務(wù)優(yōu)化方向,對于數(shù)據(jù)分析師在業(yè)務(wù)上的定位有清晰的認(rèn)知。
還有亞馬遜電商入駐商數(shù)據(jù)化運(yùn)營項目
對于電子商務(wù)零售行業(yè)而言,產(chǎn)品銷售量每日波動,入駐商在備貨時如何建立科學(xué)的銷量預(yù)測及備貨模型?訂單數(shù)據(jù)雜亂,如何用“數(shù)據(jù)抓取→數(shù)據(jù)清洗→數(shù)據(jù)分析→分析決策”的數(shù)據(jù)化運(yùn)營步驟逐一推進(jìn)?
在這個項目中,同學(xué)們首先會學(xué)習(xí)了解相關(guān)互聯(lián)網(wǎng)電商基礎(chǔ)概念,例如同比/環(huán)比/PV/UV等,然后會學(xué)習(xí)一些常用的數(shù)學(xué)分析工具,例如線性回歸、仿真計算、概率模型等,緊接著會結(jié)合相關(guān)項目數(shù)據(jù)和案例學(xué)習(xí)如何將數(shù)學(xué)分析工具應(yīng)用到業(yè)務(wù)中。在學(xué)習(xí)數(shù)據(jù)化運(yùn)營的不同體系知識時,會分別從運(yùn)營體系、倉儲體系、市場體系、產(chǎn)品體系這四個體系進(jìn)行實操訓(xùn)練。經(jīng)過這個項目后,你將對電子商務(wù)零售行業(yè)產(chǎn)生新的理解,并能從容地完成電商平臺的數(shù)據(jù)化運(yùn)營任務(wù)。
5 可視化與分析報告:有成果更要會展示
數(shù)據(jù)分析師的崗位職責(zé)決定了要深入業(yè)務(wù)、給業(yè)務(wù)提出建議,也就是要會說話,也就是要有良好的溝通能力。要做分析報告給業(yè)務(wù)部門,就需要強(qiáng)大的圖表呈現(xiàn)能力,需要針對數(shù)據(jù)特點(diǎn)進(jìn)行清晰的可視化,需要有較好的、針對業(yè)務(wù)的文字書面總結(jié)能力。
而這些能力,都能在貪心學(xué)院的商業(yè)數(shù)據(jù)分析課程中得到培養(yǎng),在課程中有對數(shù)據(jù)可視化能力的專業(yè)訓(xùn)練,例如使用Pyechart、PowerBI和Tableau等等,而且也有針對數(shù)據(jù)可視化以及分析報告撰寫的真實業(yè)務(wù)案例,例如
嗶哩嗶哩會員購平臺訂單報表分析項目
對于新興的ACG領(lǐng)域零售平臺——b站會員購平臺而言,如何從用戶產(chǎn)生的訂單報表中找到ACG用戶的產(chǎn)品需求,如何根據(jù)訂單數(shù)據(jù)尋找IP衍生品銷量與其對應(yīng)動漫作品的熱度關(guān)系,IP衍生品的運(yùn)營策略如何通過數(shù)據(jù)分析進(jìn)行優(yōu)化和改善?
在這個項目中,同學(xué)們將針對互聯(lián)網(wǎng)新興領(lǐng)域,學(xué)會靈活結(jié)合平臺內(nèi)部數(shù)據(jù)與平臺外部數(shù)據(jù)進(jìn)行分析,同時學(xué)會對數(shù)據(jù)的描述性分析(平均數(shù)、標(biāo)準(zhǔn)差、數(shù)學(xué)分布、多維可視化分析、關(guān)聯(lián)系數(shù)、詞頻分析等)。在應(yīng)對多數(shù)據(jù)來源時,學(xué)會使用數(shù)據(jù)分析工具統(tǒng)一數(shù)據(jù)格式進(jìn)行分析。
6 項目導(dǎo)向:在實踐中學(xué)習(xí)
?不論是學(xué)習(xí)Python、EXCEL、SQL等數(shù)據(jù)分析工具、學(xué)習(xí)統(tǒng)計學(xué)理論還是學(xué)習(xí)各種業(yè)務(wù)數(shù)據(jù)的分析方法,單純地聽課做題是遠(yuǎn)遠(yuǎn)不夠的,最有效、最快速的方法便是跟隨一個個項目來進(jìn)行實踐。
大家當(dāng)然可以自己在網(wǎng)絡(luò)上尋找合適的項目來進(jìn)行練習(xí),但網(wǎng)絡(luò)上項目眾多,難辨其良莠,對于新手也很難找到難度匹配、適合自己的項目,而若碰到老舊、維護(hù)較少的項目,出現(xiàn)的問題也難以與人討論,難以得到有效的指教。因此有人帶、有人指點(diǎn)、有一套成熟完整的項目體系便顯得尤為重要在貪心學(xué)院的商業(yè)數(shù)據(jù)分析課程中,課程所有的講解與練習(xí)都是以項目為中心,在一個個真實的企業(yè)業(yè)務(wù)案例中進(jìn)行提升。
以亞馬遜電商入駐商用戶畫像分析項目為例:
該項目的全部數(shù)據(jù)來源于亞馬遜平臺,包括入駐商訂單數(shù)據(jù)、流量數(shù)據(jù)、亞馬遜平臺前臺用戶搜索行為數(shù)據(jù)
對于亞馬遜入駐商而言,面對海量的數(shù)據(jù)無從下手,如何從數(shù)據(jù)中抽絲剝繭一步步發(fā)現(xiàn)并梳理用戶的標(biāo)簽成為了數(shù)字化業(yè)務(wù)轉(zhuǎn)型的重心。那么什么是用戶畫像?電商平臺的入駐商們需要如何通過前臺與后臺數(shù)據(jù)搭建用戶畫像呢?
該項目的內(nèi)容目錄如上所示,該項目將持續(xù)一周時間,經(jīng)過一周時間的磨練之后,你將學(xué)會靈活使用報表分析、數(shù)據(jù)可視化等手段以電子商務(wù)平臺入駐商的角度搭建用戶畫像體系,并且能夠獨(dú)立完成“數(shù)據(jù)抓取→數(shù)據(jù)清洗→數(shù)據(jù)分析→分析決策”的基本數(shù)據(jù)分析任務(wù)。同時,你還將學(xué)會如何通過電商業(yè)務(wù)邏輯可以實現(xiàn)從有限的數(shù)據(jù)中找到多維信息并理清其中不同維度的數(shù)據(jù)關(guān)系,例如電商入駐商如何從基本的訂單數(shù)據(jù)中實現(xiàn)價格歧視的運(yùn)營策略,如何構(gòu)建對市場的分類和用戶的區(qū)分,如何在沒有職業(yè)數(shù)據(jù)的前提下推測用戶的職業(yè)屬性。
而且整個課程由一系列的項目組成,貼近實際,貼近業(yè)務(wù),由淺入深、循序漸進(jìn),經(jīng)過這一系列的項目實戰(zhàn),你必將成為一名有經(jīng)驗的、能力全面的數(shù)據(jù)分析師。
最后,為何選擇貪心科技?
頂尖團(tuán)隊,雄厚師資。貪心學(xué)院有著實力雄厚的導(dǎo)師團(tuán)隊,教研團(tuán)隊成員由亞馬遜、谷歌、微軟高級工程師構(gòu)成,擁有極強(qiáng)的理論基礎(chǔ)和商業(yè)實戰(zhàn)經(jīng)驗:
課程完善,體系科學(xué)。貪心學(xué)院的課程由淺入深,貼近實際,貼近業(yè)務(wù),能直接將你從小白一路培養(yǎng)成合格的數(shù)據(jù)分析師。
項目導(dǎo)向,業(yè)務(wù)案例。整個課程以項目和實際的業(yè)務(wù)案例為核心,讓你接觸真實的生產(chǎn)數(shù)據(jù)、企業(yè)數(shù)據(jù),提供普通理論課程難以匹敵的實踐訓(xùn)練,極大提升你的數(shù)據(jù)分析實踐能力。
7 如何進(jìn)行職業(yè)規(guī)劃
數(shù)據(jù)分析師的職業(yè)道路大概分為以下幾個階段
初級數(shù)據(jù)分析師:
薪資6-8K,掌握Excel,PPT ,SQL等基礎(chǔ)的工具即可
工作內(nèi)容基本就是清洗數(shù)據(jù)、維護(hù)數(shù)據(jù)庫,理解數(shù)據(jù),淺層分析并簡單可視化,形成基礎(chǔ)的數(shù)據(jù)報表。
中級數(shù)據(jù)分析師:
8-15K,需要掌握Excel,SQL
tableau,Power BI,Python等等
在這一階段的數(shù)據(jù)分析師,需要熟悉數(shù)據(jù)庫,通過5W2H分析方法,邏輯樹分析方法,行業(yè)分析方法,多維度分析方法,對比分析方法,假設(shè)檢驗分析方法,相關(guān)分析方法,群組分析方法,RFM分析方法,AARRR模型分析方法,漏斗分析方法等,并且要有一定的口才和溝通能力,能通過語言和數(shù)據(jù)可視化方案來對整體數(shù)據(jù)進(jìn)行展示。
高級數(shù)據(jù)分析師:
15k+,上不封頂
這時候的數(shù)據(jù)分析師將不僅局限于Excel,SQL,Python 等等基礎(chǔ)技能,還要懂很多數(shù)據(jù)科學(xué)方面的內(nèi)容,例如數(shù)理統(tǒng)計、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法、R語言等等
高級數(shù)據(jù)分析師不僅要熟悉編程和數(shù)學(xué)、算法等等,更要對行業(yè)有深入的理解,有遠(yuǎn)見,有業(yè)務(wù)的敏感性,有清晰的分析思路,能運(yùn)用數(shù)據(jù)獨(dú)立對企業(yè)的運(yùn)行和管理進(jìn)行科學(xué)的分析并產(chǎn)出量化的結(jié)果,并有優(yōu)秀的溝通能力,展示數(shù)據(jù)分析的成果,協(xié)調(diào)并指導(dǎo)企業(yè)進(jìn)行決策。
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的数据分析如何入门,以及如何做职业规划?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 恒生指数开户是什么意思
- 下一篇: 企业年金退休后怎么领取 是不是打到社保卡