贝叶斯数据分析_周末说说数据分析(2)
上個周我們聊到了這本書講到的一到三章,第一章呢是講數(shù)據(jù)分析的一些理念,聊到數(shù)據(jù)分析開始前要了解數(shù)據(jù)背后的故事,了解數(shù)據(jù)提供者的心智模型(說白了也就是數(shù)據(jù)管理者關于數(shù)據(jù)的看法),然后才開始分析數(shù)據(jù);第二章講到了企業(yè)經(jīng)營者或者其他人員可能對我們的分析產(chǎn)生干擾,企業(yè)經(jīng)營者也可能對我們的分析結(jié)果進行質(zhì)疑。我們要做的是,找出經(jīng)營者與數(shù)據(jù)分析結(jié)果沖突的地方,從而進行解釋。如果無法解釋沖突點,就要合理懷疑我們根據(jù)數(shù)據(jù)分析出的結(jié)論;第三章講了在若干約束條件情況下的最優(yōu)解。
周末說說數(shù)據(jù)分析(1)
本周我們繼續(xù)來聊聊這本書第四到六章。
第四章講數(shù)據(jù)圖形化和數(shù)據(jù)關系探索,里面主要講關于大量多維數(shù)據(jù)可視化,以及尋求數(shù)據(jù)間的因果關系。書中提供了一種叫做散點圖的工具用于探索二維到多維數(shù)據(jù)因果關系。關于散點圖的使用,這里只需要看這個圖就可以了(下圖為一個描述電商系統(tǒng)各項運營指標和營收之間關系的散點圖)
第五章講假設檢驗,這章其實很簡單。就是要讓我們對假設證偽,而不是依據(jù)直覺。其實我想起名偵探柯南里面一句經(jīng)典臺詞:排除所有不可能,剩下的結(jié)論無論多么不合理,都是答案。而對于無法證偽的假設,要看相關證據(jù)對假設的支持力度。選擇證據(jù)支持最強的假設,同時要動態(tài)加入新的證據(jù)。
個人感覺這一章其實并不是在講數(shù)據(jù)分析,但是在說推理,感興趣可以看看原書。
第六章是說貝葉斯統(tǒng)計,就是根據(jù)一項針對某疾病的測試結(jié)果和一些統(tǒng)計數(shù)據(jù),估計你得這項疾病的幾率,關于貝葉斯統(tǒng)計和傳統(tǒng)頻率統(tǒng)計感覺特別燒腦。主要就是這兩個東東:
1) 條件概率P(a|b):指在b事件發(fā)生時,發(fā)生a事件的概率,原書中用P(L|+)表示在已經(jīng)測試為陽性的情況下,患蜥蜴流感的概率。
2)貝葉斯概率公式:P(L|+)=P(L)*P(+|L)/(P(L)*P(+|L)+P(~L)*P(+|~L)),其中P(L)+P(~L)=1, 為基礎概率,新的信息會改變基礎概率,此時應該用新的基礎概率導入重新計算。第七章貌似也是講貝葉斯統(tǒng)計,我再琢磨琢磨,下周再更。這次前兩章還好,第六章對學渣來說確實太不友好了。
其實看到這里,這本書一些理念我其實非常贊同,但是就目前來說,有些實操,個人感覺最優(yōu)解問題和散點圖似乎都可以用于財務預測,但是貝葉斯統(tǒng)計暫時沒想到應用場景。
本文僅作記錄,下周見。
《新程序員》:云原生和全面數(shù)字化實踐50位技術(shù)專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結(jié)
以上是生活随笔為你收集整理的贝叶斯数据分析_周末说说数据分析(2)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: plt title设置在下方_Pytho
- 下一篇: 三星关闭shell提示_凌晨系统崩溃,低