两个重要极限_算法数学基础-概率论最重要两个结论:大数定律及中心极限定理...
到這一章,概率的基本概念我們已經(jīng)梳理完了。這些概念構建起來的概率空間給了我們強有力的分析不確定性的工具,概念非常重要只有對概念有準確的理解才能應用好這些有力的工具。數(shù)學是很抽象的東西,他源于實踐但高于實踐(是不是很像藝術啊),所以很多概念不可能一遍吃透,要反復的復習理解。大學那點數(shù)學底子估計90%的人都已經(jīng)還給老師了,但是是一個很好的基礎,搞算法數(shù)學基礎一定要扎實,否則很難做好。(一點體會與算友們分享)
今天介紹的兩個概率論中的非常重要的概念,大數(shù)定律和中心極限定理。這兩個規(guī)律告訴我們,在不確定的世界里也是有規(guī)律可循的。
大數(shù)定律說的是部分數(shù)據(jù)在某些條件下可以反映總體規(guī)律,是對大系統(tǒng)可通過對其抽樣來研究整體特性的的理論基礎。專業(yè)一點的說法是隨機變量序列的前一些項(部分)的算術平均值在某種條件下收斂算術平均值(整體)。是不是很簡單啊!和以往一樣,我們不關注定理的推導,如果有興趣可以看一下教材(用到了切比雪夫不等式)。比如說我們抽檢一批產(chǎn)品的合格率是否滿足要求,而產(chǎn)品的數(shù)量非常多比如有幾十萬個,我們會抽樣n個批次,每一批次的抽樣都可以看成一次隨機實驗,三批抽樣的合格率的平均值如果都在95以上,我們就會認為整批產(chǎn)品的合格率超過了95%。這個依據(jù)就是大數(shù)定律。這個大數(shù)和我們平時看到被熱炒的大數(shù)據(jù)中的大數(shù)還不是一回事,但在抽樣這個角度確實有些關聯(lián)。要注意以下大數(shù)定律應用的條件,就是隨機變量的數(shù)學期望存在,并且隨機變量之間相互獨立(可以簡單理解為每一次試驗是獨立的,相互之間沒有關系)。條件大家一定要注意,不然會用錯。
大數(shù)定律有兩個,一個叫辛欽大數(shù)定律-弱大數(shù)定律,還有一個叫伯努利大數(shù)定律。本質上講的是一回事,伯努利大數(shù)定理說了另外一件事就是如果事件A可能發(fā)生,那么在足夠多的嘗試后就一定會發(fā)生(這不就是墨菲定律嘛,機場、高鐵站都有得賣,其實概率論里早就說清楚了,我還買了一本,哈哈哈)舉個例子,如果有天上掉餡餅的可能,那么在足夠多的天數(shù)的情況下這個餡餅一定會掉下來。腦洞開一下,如果氨基酸和蛋白質有可能隨機形成,那么在足夠長的時間里一定會形成,如果生命有可能出現(xiàn),那么在足夠長時間里,一定會出現(xiàn)啊!!天哪,進化論難道是這么理解嗎?如果這么推論,那么一定會有外星智慧生命啊!(細思極恐)
中心極限定理討論的是一種特殊的分布-正態(tài)分布出現(xiàn)的條件。之前我們介紹過,很多隨機現(xiàn)象都滿足正態(tài)分布,比如電路的熱噪聲、男人身高的分布等等。這個定理告訴我們,正態(tài)分布出現(xiàn)的充分必要條件(在科研的時候會用的著,如果我們看到的實驗數(shù)據(jù)符合正態(tài)分布,那說明實驗一定滿足了正態(tài)分布的條件,那個漂亮個高斯曲線實在是太熟悉了)。這個條件是啥呢?
均值和方差存在的獨立同分布隨機變量,那么他們疊加的結果,當n充分大的時候,分布是滿足0-1正態(tài)分布!!!!我的天啊,這不就是說如果結果是正態(tài)的,那么一定是由多個獨立同分布的現(xiàn)象疊加起來的嘛!!!!我們實驗中看到的那個結果高斯曲線,是若干不確定結果疊加的必然現(xiàn)象啊!所以,那些個復雜系統(tǒng)呈現(xiàn)出來的某種狀態(tài)很可能滿足高斯分布,放心的用高斯函數(shù)去擬合吧!
中心極限定理還可以用其他兩種形式,一個叫李雅普諾夫定理,一個叫隸莫佛-拉普拉斯定理。李氏定理說的是不論相互獨立的隨機變量各自分布如何,當n(隨機變量的個數(shù))足夠大的時候,也滿足正態(tài)分布。后面那個定理說的是二項分布的極限為正態(tài)分布!其實都是中心極限定理的某種補充和特例。從中心極限是不是可以得出,正態(tài)分布這個形式是復雜系統(tǒng)不確定性的一般規(guī)律呢?大家各自發(fā)揮想象吧。
至此,所有概率論的中的重點內容介紹完了!
總結
以上是生活随笔為你收集整理的两个重要极限_算法数学基础-概率论最重要两个结论:大数定律及中心极限定理...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【三】版本之间穿梭切换
- 下一篇: Linux学习之C语言的进程与线程编程