《统计学》学习笔记之数据的收集
鄙人學(xué)習(xí)筆記
文章目錄
- 數(shù)據(jù)的收集
- 數(shù)據(jù)的來(lái)源
- 調(diào)查數(shù)據(jù)
- 數(shù)據(jù)的誤差
數(shù)據(jù)的收集
數(shù)據(jù)的來(lái)源
- 數(shù)據(jù)的間接來(lái)源
如果與研究?jī)?nèi)容有關(guān)的原信息已經(jīng)存在,我們只是對(duì)這些原信息重新加工、整理,使之成為我們進(jìn)行統(tǒng)計(jì)分析可以使用的數(shù)據(jù),則把它們稱為間接來(lái)源的數(shù)據(jù)。
- 數(shù)據(jù)的直接來(lái)源
雖然二手?jǐn)?shù)據(jù)具有搜集方便、數(shù)據(jù)采集快、采集成本低等優(yōu)點(diǎn),但對(duì)一個(gè)特定的研究問(wèn)題而言,二手資料的主要弱點(diǎn)是針對(duì)性不夠,所以僅僅靠二手資料還不能回答研究所提出的問(wèn)題,這時(shí)就要通過(guò)調(diào)查和實(shí)驗(yàn)的方法直接獲得一手資料。我們把通過(guò)
調(diào)查方法獲得的數(shù)據(jù)稱為調(diào)查數(shù)據(jù),把通過(guò)實(shí)驗(yàn)方法得到的數(shù)據(jù)稱為實(shí)驗(yàn)數(shù)據(jù)。
調(diào)查數(shù)據(jù)
- 概率抽樣
概率抽樣也稱隨機(jī)抽樣,是指遵循隨機(jī)原則進(jìn)行的抽樣,總體中每個(gè)單位都有一定的機(jī)會(huì)被選入樣本。
它具有下面幾個(gè)特點(diǎn):
①抽樣時(shí)是按一定的概率以隨機(jī)原則抽取樣本。所謂隨機(jī)原則就是在抽取樣本時(shí)排除主觀上有意識(shí)地抽取調(diào)查單位,使每個(gè)單位都有一定的機(jī)會(huì)被中。
②每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來(lái)的。
③當(dāng)用樣本對(duì)一總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率。這就是說(shuō),估計(jì)量不僅與樣本單位的觀測(cè)值(也稱為觀察值)有關(guān).也與其人樣概率有關(guān)。
- 概率抽樣與等概率抽樣
需要提及的是,概率抽樣與等概率抽樣是兩個(gè)不同的概念。當(dāng)我們談到概率抽樣時(shí),是指總體中的每個(gè)單位都有一定的非零概率被抽中,單位之間被抽中的概率可以相等,也可以不等。若是前者,稱為等概率抽樣;若是后者.稱為不等概率抽樣。
- 概率抽樣的幾種類型
①簡(jiǎn)單隨機(jī)抽樣:簡(jiǎn)單隨機(jī)抽樣就是從包括總體N個(gè)單位的抽樣框中隨機(jī)地、一個(gè)個(gè)地抽取n個(gè)單位作為樣本.每個(gè)單位的入樣概率是相等的。
②分層抽樣:分層抽樣是將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本。再將各層的樣本結(jié)合起來(lái),對(duì)總體的目標(biāo)量進(jìn)行估討。
③整群抽樣: 將總體中若干個(gè)單位合并為組,這樣的組稱為群。抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查,這樣的抽樣方法稱為整群抽樣。
④系統(tǒng)抽樣:將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位,這種抽樣方法稱為系統(tǒng)抽樣
⑤多階段抽樣:采用類似整群抽樣的方法,首先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查。因?yàn)槿〉眠@些接受調(diào)查的單位需要兩個(gè)步驟,所以將這種抽樣方式稱為二階段抽樣。
這里,群是初級(jí)抽樣單位,第二階段抽取的是最終抽樣單位。將這種方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣。
- 非概率抽樣
非概率抽樣是相對(duì)于概率抽樣而言的,指抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的對(duì)數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對(duì)其實(shí)施調(diào)查。
- 非概率抽樣的幾種類型
①方便抽樣:調(diào)查過(guò)程中由調(diào)查員依據(jù)方便的原則,自行確定人抽樣本的單位。
②判斷抽樣:判斷抽樣是另一種比較方便的抽樣方式,是指研究人員根據(jù)經(jīng)驗(yàn)、判斷和對(duì)研究對(duì)象的了解,有目的地選擇一些單位作為樣本,實(shí)施時(shí)根據(jù)不同的目的有重點(diǎn)抽樣、典型抽樣、代表抽樣等方式。
③資源樣本:自愿樣本指被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息。
④滾雪球抽樣:滾雪球抽樣往往用于對(duì)稀少群體的調(diào)查。在滾雪球抽樣中,首先選擇一組調(diào)查單位,對(duì)其實(shí)施調(diào)查之后,再請(qǐng)他們提供另外一些屬于研究總體的調(diào)查對(duì)象,調(diào)查人員根據(jù)所提供的線索,進(jìn)行此后的調(diào)查。這個(gè)過(guò)程持續(xù)下去,就會(huì)形成滾雪球效應(yīng)。
⑤配額抽樣:它是首先將總體中的所有單位按一定的標(biāo)志(變量)分為若干類,然后在每個(gè)類中采用方便抽樣或判斷抽樣的方式選取樣本單位。
- 概率抽樣與非概率抽樣的比較
- 搜集數(shù)據(jù)的基本方法
①自填式
②面訪式
③電話式
數(shù)據(jù)的誤差
- 抽樣誤差
抽樣誤差是由抽樣的隨機(jī)性引起的樣本結(jié)果與總體真值之間的誤差。
抽樣誤差并不是針對(duì)某個(gè)具體樣本的檢測(cè)結(jié)果與總體真實(shí)結(jié)果的差異而言的,抽樣誤差描述的是所有樣本可能的結(jié)果與總體真值之間的平均差異。
抽樣誤差的大小與多方面因素有關(guān):
①最明顯的是樣本量的大小,樣本量越大,抽樣誤差就越小。
②抽樣誤差的大小還與總體的變異性有關(guān)。總體的變異性越大,即各單位之間的差異越大,抽樣誤差也就越大;反之,總體的變異性越小,各單位之間越相似,抽樣誤差也就越小。
- 非抽樣誤差
非抽樣誤差是相對(duì)抽樣誤差而言的,是指除抽樣誤差之外的,由其他原因引起的樣本觀察結(jié)果與總體真值之間的差異。
抽樣誤差是一種隨機(jī)性誤差,只是存在于概率抽樣中;非抽樣誤差則不同,無(wú)論是概率抽樣、非概率抽樣,或是在全面調(diào)查中,都有可能產(chǎn)生非抽樣誤差。
- 非抽樣誤差有以下幾種類型:
①抽樣框誤差
②回答誤差
③無(wú)回答誤差
④調(diào)查員誤差
⑤測(cè)量誤差
- 誤差的控制
抽樣誤差是由抽樣的隨機(jī)性帶來(lái)的,只要采用概率抽樣,抽樣誤差就不可避免。令人欣慰的是,抽樣誤差是可以計(jì)算的。進(jìn)行控制的一個(gè)主要方法是改變樣本量,統(tǒng)計(jì)方法已經(jīng)給出了計(jì)算樣本量的公式,要求的抽樣誤差越小,所需要的樣本量就越大。
非抽樣誤差與抽取樣本的隨機(jī)性無(wú)關(guān),因而在概率抽樣和非概率抽樣中都會(huì)存在。
總結(jié)
以上是生活随笔為你收集整理的《统计学》学习笔记之数据的收集的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 谷歌预测景深新研究:单一视点也能合成3D
- 下一篇: 《统计学》学习笔记之数据的图表展示