python计算标准差为什么分母要-1_为什么样本方差(sample variance)的分母是 n-1?...
很多人其實忘記了樣本標準差的目的是干什么用的,我對復雜的數學公式證明不感興趣(反正書上有),下面我聊下這背后的原因。
首先,方差的開方是標準差,我更喜歡經常用標準差,原因見這里:猴子:有了方差為什么需要標準差?
1.樣本標準差為什么除以n-1
當你選擇一個樣本后,相比總體,你擁有數據的數量是變少了,因此,與總體中的數值偏離平均值的程度相比,樣本中很有可能把較為極端的數值排除在外,這樣使得數值更有可能以更緊密的方式聚集在均值周圍。
也就是說,樣本的標準差要小于總體標準差。
所以,為了更好的用樣本估計總體的標準差,統計學家就將標準差的公式做了改造:即原來的標準差公式是除以n,為了用樣本估計總體標準差,現在是除以n-1。這樣就使得標準差略大。彌補了樣本的標準差小于總體標準差的不足。
所以很多書上會直接把除以n-1的標準差叫做樣本標準,其實這個樣本標準差的目的是用于估計總體標準差。
2.你可能會疑惑,那我什么時候標準差除以n還是n-1呢?
其實,這個問題我的一個社群會員@胡小白 也問過這個問題:
只要你記住使用標準差的目的是什么,就不會搞錯了。
如果你只是想計算一個數據集的標準差,那么就除以n。例如你有100個畢業與清華人的收入,只是想了解這100個人構成的數據集的波動大小,那你就用除以n的標準差公式。
如果你想用樣本來估計總體的標準差,那就用除以n-1的標準差公式。例如你想把剛才例子中這100個人當成一個樣本,用這個樣本來估計出總體(所有畢業與清華人的收入)的標準差,那么就除以n-1的標準差公式。
3. @問兒 留言提出一個很好的問題:
總結
以上是生活随笔為你收集整理的python计算标准差为什么分母要-1_为什么样本方差(sample variance)的分母是 n-1?...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: cocos2d-x for wp 之Bo
- 下一篇: Windows XP中快速识别真假SVC