DC学院学习笔记(十四):总体、采样及Error Bar
生活随笔
收集整理的這篇文章主要介紹了
DC学院学习笔记(十四):总体、采样及Error Bar
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
相關概念
1.采樣相關概念
- 總體:研究對象的全體
- 樣本:從總體中的隨機抽樣
- 采樣偏差:是由于抽樣過程中沒有達到足夠隨機而產生 、
抽樣的方式會嚴重影響樣本的隨機性,從而影響對總體的預測,抽樣的方法有多種,可以使用一定的方法來減小采樣誤差,然而采樣誤差是無法避免的。
2.誤差:不確定性的某種表示
-
標準差:使用標準差畫error bar;用于表征數據分散程度
- 總體標準差:
- 樣本標準差:
-
Bootstrap置信區間:用總體統計量的估計區間畫error bar;用于表征數據的波動范圍
- 可重復采樣:抽取的個體仍可參加下次采樣,常用于估計總體統計量的置信區間
- 如何使用Bootstrap計算置信區間(Quantile算法):用重采樣的采樣方法,計算統計量并排序,取相應的分位數,作為置信區間的邊界
推薦閱讀:如果你有興趣,可以閱讀《An Introduction to the Bootstrap》這本書了解更多關于Bootstrap的知識和其他計算置信區間的方法
- seaborn畫圖參數區別:1)使用標準差繪制error bar:ci=’sd’ 2)使用Bootstrap置信區間畫error bar:ci & n_boot
代碼如下:
import pandas iris = pandas.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data') iris.columns=['sepal_length','sepal_width','petal_length','petal_width','species'] import seaborn %matplotlib inline seaborn.barplot(x='species',y='petal_length',data=iris,ci='sd') seaborn.barplot(x='species',y='petal_length',data=iris,ci=90,n_boot=1000)Error Bar:黑線即為Error Bar,在每一列上的Error Bar 表征:在給定的置信區間下,統計量的范圍會在黑線內波動
總結
以上是生活随笔為你收集整理的DC学院学习笔记(十四):总体、采样及Error Bar的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基本图形的扫描转换(绘图函数的自定义实现
- 下一篇: TCP/IP协议之网络链接的背后故事