可汗学院学习总结(一)
1.總體(Population)與樣本(Sample)
- 總體是研究對(duì)象的整體,通常數(shù)目很大,直接對(duì)總體進(jìn)行分析費(fèi)時(shí)費(fèi)力。因此通過對(duì)總體進(jìn)行抽樣得到可以代表總體的樣本。
- 一般都是采用樣本估計(jì)總體的方式,畢竟總體數(shù)量太大,將總體可劃分為訓(xùn)練集,驗(yàn)證集和測(cè)試集。
2.均值(mean)
令總體數(shù)為N,樣本數(shù)為n,每一個(gè)樣本的取值用表示xix_{i}xi?,則:
- 總體均值:μ=1N∑i=1Nxi\mu=\frac{1}{N} \sum_{i=1}^{N} x_{i}μ=N1?∑i=1N?xi?
- 樣本均值:x ̄=1n∑i=1nxi\overline{x}=\frac{1}{n} \sum_{i=1}^{n} x_{i}x=n1?∑i=1n?xi?
3.方差(Variance)與標(biāo)準(zhǔn)差(Standard deviation)
方差和標(biāo)準(zhǔn)差描述的是數(shù)據(jù)的離散程度,也就是遠(yuǎn)離中心的程度:
- 總體方差:σ2=1N∑i=1N(xi?μ)2\sigma^{2}=\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}σ2=N1?∑i=1N?(xi??μ)2
- 樣本方差:sn2=1n∑i=1n(xi?x ̄)2s_{n}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}sn2?=n1?∑i=1n?(xi??x)2
這個(gè)公式計(jì)算的方差通常會(huì)低估總體的方差:當(dāng)樣本分布與總體分布相近時(shí),計(jì)算得到的樣本均值接近總體均值,這時(shí)得到的樣本方差也就接近總體方差;但是可能的情況是,采樣得到的樣本與總體偏差較大時(shí)(有偏的),由于樣本均值總是分布在樣本點(diǎn)的中心,這時(shí)樣本點(diǎn)與樣本均值之間的距離小于與總體均值的距離,計(jì)算得到的樣本方差小于總體方差。這是一種更普遍的情況,因此用上式計(jì)算得到的方差通常會(huì)低估總體方差。
- 無偏的樣本方差:s2=1n?1∑i=1n(xi?x ̄)2s^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}s2=n?11?∑i=1n?(xi??x)2
將分母改為n-1,相當(dāng)于以一個(gè)大于1的系數(shù)修正了有偏的方差。實(shí)驗(yàn)證明,這個(gè)公式能更好地估計(jì)總體方差。上述情況是在我們不知道總體的均值時(shí),否則就不需要用n-1來保持無偏了。
- 總體標(biāo)準(zhǔn)差:σ=1N∑i=1N(xi?μ)2\sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}σ=N1?∑i=1N?(xi??μ)2?
- 樣本標(biāo)準(zhǔn)差: s=1n?1∑i=1n(xi?x ̄)2s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}}s=n?11?∑i=1n?(xi??x)2?
4.隨機(jī)變量、概率密度函數(shù)、期望
-
隨機(jī)變量實(shí)際上是一種函數(shù),只有在隨機(jī)過程中才給它賦值。
-
概率密度函數(shù)下方的面積表示的才是概率,是概率密度函數(shù)在某一個(gè)區(qū)間內(nèi)的積分。任何一個(gè)確切的點(diǎn)的概率值為0
-
期望值(Expected value):對(duì)于隨機(jī)變量來說,總體數(shù)是無窮的,計(jì)算總體均值時(shí)我們無法將所有的值相加再除以無窮。因此,將每個(gè)數(shù)值的出現(xiàn)的頻率乘以數(shù)值然后對(duì)所有數(shù)值求和,就得到了期望。期望值實(shí)際上等同于總體均值。
5.二項(xiàng)分布
二項(xiàng)分布就是重復(fù)n次獨(dú)立的伯努利實(shí)驗(yàn)。在每次試驗(yàn)中只有兩種可能的結(jié)果,而且兩種結(jié)果發(fā)生與否互相對(duì)立,并且相互獨(dú)立,與其它各次試驗(yàn)結(jié)果無關(guān),事件發(fā)生與否的概率在每一次獨(dú)立實(shí)驗(yàn)中都保持不變,則這一系列試驗(yàn)總稱為n重伯努利實(shí)驗(yàn),當(dāng)試驗(yàn)次數(shù)為1時(shí),二項(xiàng)分布服從0-1分布。
用p表示一次實(shí)驗(yàn)中成功的概率,1-p表示一次實(shí)驗(yàn)中失敗的概率,則二項(xiàng)分布n次獨(dú)立重復(fù)性實(shí)驗(yàn)中,成功的次數(shù)k的概率為:
- P(x=k)=n!k!(n?k)!pk(1?p)n?kP(x=k)=\frac{n !}{k !(n-k) !} p^{k}(1-p)^{n-k}P(x=k)=k!(n?k)!n!?pk(1?p)n?k
6.二項(xiàng)分布的期望
E(X)=npE(x)=∑k=0nk?(nk)?pk(1?p)n?k=∑k=0nk?n!k!(n?k)!?pk(1?p)n?k=∑k=1nk?n(n?1)!k(k?1)!(n?k)!?p?pk?1(1?p)n?k=np∑a=0n?1b!a(k?1)!(n?k)!?p?pk?1(1?p)n?k=npn?1b!a!(b?a)!?p?pk?1(1?p)n?k=np?1=np\begin{aligned} E(X) &=n p \\ E(\mathrm{x}) &=\sum_{k=0}^{n} k \cdot\left(\begin{array}{c}{n} \\ {k}\end{array}\right) \cdot p^{k}(1-p)^{n-k} \\ &=\sum_{k=0}^{n} k \cdot \frac{n !}{k !(n-k) !} \cdot p^{k}(1-p)^{n-k} \\ &=\sum_{k=1}^{n} k \cdot \frac{n(n-1) !}{k(k-1) !(n-k) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p \sum_{a=0}^{n-1} \frac{b !}{a(k-1) !(n-k) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p^{n-1} \frac{b !}{a !(b-a) !} \cdot p \cdot p^{k-1}(1-p)^{n-k} \\ &=n p \cdot 1 \\ &=n p \end{aligned}E(X)E(x)?=np=k=0∑n?k?(nk?)?pk(1?p)n?k=k=0∑n?k?k!(n?k)!n!??pk(1?p)n?k=k=1∑n?k?k(k?1)!(n?k)!n(n?1)!??p?pk?1(1?p)n?k=npa=0∑n?1?a(k?1)!(n?k)!b!??p?pk?1(1?p)n?k=npn?1a!(b?a)!b!??p?pk?1(1?p)n?k=np?1=np?
二項(xiàng)分布的方差:E(X)=np(1?p)E(X)=n p(1-p)E(X)=np(1?p)
總結(jié)
以上是生活随笔為你收集整理的可汗学院学习总结(一)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 硬件模拟面试题整理
- 下一篇: Augmented Reality La