统计学_第一章_统计和数据
一、統計的含義
(一)什么是統計學
定義:統計學是用以收集數據、分析數據和由數據得出結論的一組概念、原則和方法。
(二)統計分析數據的方法
可分為描述統計和推斷統計,兩大類。
1、推斷統計
是研究如何通過樣本數據推斷總體特征的統計學方法,內容包括參數估計和假設性檢驗。
2、描述統計
是研究數據搜集、處理和描述的統計學方法。內容包括如何獲取研究所需要的數據,如何用圖表形式對數據進行處理和展示,如何通過對數據的綜合、概括與更新,得出所關心的數據特征。
(三)統計的應用
統計是適用于所有學科領域的通用數據分析方法,是一種通用的數據分析語言。
二、數據類型
(一)變量與數據
1、變量
從一次觀察到下一次觀察會出現不同的的結果,如,溫度、教育程度、股市證券、職業、收入等。
2、數據
把觀察到的結果記錄下來就是數據。
(二)數據類型
1、定性變量(數據)
是從現象的屬性來表現現象的特征。如,天氣形勢、職業、教育程度、產品型號、血型等。定性變量的觀察結果稱為定性數據。
特點:只能反映現象的屬性特點,而不能說明具體量的大小和差異,只有分類特征,沒有量的特征。
定性變量可分為分類變量和順序變量。
(1)分類變量
是指反映現象分類特征的變量。如,職業、血型、性別等。分類變量的觀察結果就是分類數據。
特點:
- 沒有數值特征,不能對其數據進行數學計算;
- 只能用來區分事物,而不能用來表明事物之間的大小、優劣關系。
(2)順序變量
是指類別具有一定的順序,個人覺得是一種特殊的分類變量。如,受教育程度、產品等級、治療效果等。順序變量的觀察結果就是順序數據。
特點:
- 不僅能用來區分客觀現象的不同類別,而且還可以表明現象之間的大小、高低、優劣關系。
- 順序數據的數據之間雖然可以比較大小,卻無法計算相互之間大小、優劣、高低的距離。
2、定量變量(數據)
也稱為數值變量,可以用數值表示其觀察結果,而且這些數值具有明確的數值含義,不僅能分類而且能測量出具體大小和差異。如溫度、收入、分數等。定量變量的觀察結果稱為定量數據。
特點:都是以數值的形式出現,有些數值型數據只可以計算數據之間的絕對差(絕對距離),而有些數值型數據不僅可以計算數據之間的絕對差,還可以計算數據之間的相對差(相對距離)。
3、觀測數據和實驗數據
根據獲取數據的方法不同,可分為觀測數據和實驗數據。
(1)觀測數據
是對客觀事物進行實地觀測所取得的的數據,在數據取得的過程中一般沒有人為的控制和條件約束。在社會經濟問題研究中,觀測是取得數據最主要的方法。
(2)實驗數據
一般是在科學實驗環境下取得的數據。自然科學研究中所用的數據多為實驗數據。
三、數據來源與搜集數據的方法
(一)數據的來源
統計數據資料的來源主要有兩種:
- 通過直接的調查或實驗獲得的原始數據,這是統計數據的直接來源,一般稱之為原始或第一手統計數據。
- 別人調查的數據,并將這些數據進行加工和匯總后公布的數據,這是統計數據的間接來源,通常稱之為次級數據或第二手間接的統計數據。
注:一切間接的統計數據都是從原始的、第一手統計數據過度而來的。
1、數據的直接來源——原始數據
搜集數據最基本的形式就是進行統計調查或進行實驗活動。統計調查或進行實驗就是統計數據的直接來源。
(1)統計調查
是指根據統計研究預定的目的、要求和任務,運用科學的方法,有計劃、有組織的向客觀實際搜集資料的過程。
通過統計調查得到的數據,一般叫做觀測數據。
(2)實驗法
通過實驗法得到的數據就是實驗數據。
在實驗中往往需要將研究對象分為兩個組,一個實驗組,一個對照組。對實驗組的輸入變量加以控制或改變,對照組則不加控制。根據兩組的輸出結果,可以看到輸入變量對輸出的影響。
運用實驗法的注意事項:
- 實驗組和對照組的產生應當是隨機的,研究對象的不同單位應當被隨機的分配到實驗組或對照組,而不應是經過有意識的挑選。
- 實驗組和對照組應當是匹配的,也就是研究對象的背景資料應當是大體相同的,至少不要差異太大。
2、數據的間接來源——次級數據
次級數據(第二手數據)是指由他人搜集和整理得到的統計數據。
次級數據包括:
- 公開出版的統計數據,主要來自官方的統計部門和政府、組織、學校、科研機構。如:《中國統計年鑒》、《人口普查資料匯編》、《北京市統計年鑒》、《世界發展報告》等。
- 尚未公開發表的統計數據,如各企業的經營報表數據,專業調查咨詢機構未公開發布的調查結果數據。
注意:如果公開引用未公開發表的數據需要征得數據所有者的同意,同時為自己發的數據負責。
(二)搜集數據的方法
包括,普查、抽樣調查、統計報表、重點調查、典型調查
1、普查
(1)定義
普查是專門組織的一次性的全面調查,用來調查屬于一定時點上或一定時期內的==社會現象總量。==比如:人口普查、農業普查、經濟普查等。
(2)適用范圍
適用于搜集某些不能或不適宜定期的全面統計報表搜集的統計資料。以摸清重大的國情、國力。
(3)特點
普查是一種全面調查,也是一次性的專門調查。
(4)優點
資料包括的范圍全面、詳盡、系統。
(5)缺點
普查的工作量大、耗資也多,時間周期較長,一般不宜經常舉行。
2、抽樣調查
(1)定義
是一種非全面調查,它是按照隨機原則從總體中抽取一部分單位作為樣本進行觀察研究,以抽樣樣本的指標去推算總體指標的一種調查。
(2)特點:
- 樣本單位按隨機原則抽取,排除了主觀因素對樣本對選取樣本單位的影響。
- 能夠根據部分調查的實際資料對調查對象的總體數量特征進行推斷,從而達到對調查總體的認識。
- 在抽樣調查中會存在抽樣誤差,但是這個誤差可以事先計算并加以控制。
(3)優點
既能節省人力、財力、物力,又可以提高資料的時效性,而且能取到比較正確的全面統計資料。
抽樣調查是一種非全面的、一次性或經常性的專門調查,這種調查方法在市場經濟條件下,使用非常廣泛。
(4)抽樣方法
主要有兩種:概率抽樣和非概率抽樣
① 概率抽樣
概率抽樣是根據一個已知的概率隨機選取被調查者。
常用的概率抽樣形式包括:簡單隨機抽樣、分層抽樣、整群抽樣、系統抽樣。
A、簡單隨機抽樣
簡單隨機抽樣是完全隨機地選擇樣本,是最基本的形式。
B、分層抽樣
分層抽樣是首先將總體分成不同的“層(或組)”,然后在每一層內進行抽樣。
C、整群抽樣
整群抽樣是將一組被調查者視為一個抽樣單位,每次抽取時抽出來的是一組(群),而不是一個個體單位。
D、系統抽樣
系統抽樣又稱為等距抽樣,是在總體的名錄框中每隔一定距離抽取一個被調查者。
② 非概率抽樣
非概率抽樣是沒有完全按照隨機原則選取樣本單位。
非概率抽樣不能保證抽出來的部分單位(樣本單位)對總體單位的代表性,不能夠由樣本的特征準確地推斷總體的特征,但是由于該種方法簡單、經濟,所以也是人們常用的方法。
3、統計報表
(1)定義
統計報表是按照國家統一規定的調查要求與文件(指標、表格形式、計算方法等)自下而上的提供統計資料的一種調查方式。
國家利用統計報表定期地得到全社會的國民經濟與社會發展情況的基本統計資料,是國家取得調查資料的方法之一。
(2)分類
① 按照報送范圍,統計報表分為全面報表和非全面報表。
- 全面報表要求調查對象中的每一個單位均要填報。
- 非全面報表則只要求一部分調查單位填報。
② 按照報送周期,統計報表可分為月報、季報、年報。
- 月報內容簡單,時效性強
- 年報則內容比較全面。
(3)統計報表的內容
① 表式
表式由國家統計部門根據研究的任務與目的而專門設計制定的統計報表表格,用于搜集統計資料。它是統計報表制度的主體。
② 填表說明
填表說明是對統計報表的統計范圍、指標等作出的規定。
對于大型、國有企業來說,利用統計報表搜集數據,具有時間快、成本低的優點,但對于大量的小型、非國有經濟單位來說,則難以全面采用統計報表調查。
4、重點調查
(1)定義
重點調查是在調查對象中選擇一部分重點單位進行的一種非全面調查。
這些重點單位雖然數目不多,但它們具有所研究現象的總量在總體總量中占據絕大部分的特點。
(2)適用范圍
當調查的任務只要求掌握事物的基本概況與基本的發展趨勢,而不要求掌握全面的準確資料,而且在總體中確實存在著重點單位時,進行重點調查是比較適宜的。
(3)優點
重點調查可以節省人力、財力,而且及時。
5、典型調查
(1)定義
典型調查是一種非全面的專門調查,它是根據調查的目的與要求,在對被調查對象進行全面分析的基礎上,有意識地選擇若干具有典型意義的或有代表性的單位進行的調查。
(2)作用
- 補充全面調查的不足
- 在一定的條件下可以驗證全面調查數據的真實性
(3)優點
靈活機動、通過少數典型即可取得深入、詳實的統計資料。
(4)缺點
由于受“有意識的選取若干有代表性”的限制,在很大程度上受人們主觀認識上的影響。
典型調查必須同其他調查結合起來使用,才能避免出現片面性。
各類統計調查方法的特點對比
| 普查 | 全面 | 一次 | 采訪、報告或空間遙感 |
| 抽樣調查 | 非全面 | 經常或一次 | 直接觀察或采訪 |
| 統計報表 | 全面或非全面 | 經常 | 報告 |
| 重點調查 | 非全面 | 經?;蛞淮?/td> | 報告 |
| 典型調查 | 非全面 | 一次 | 采訪 |
總結
以上是生活随笔為你收集整理的统计学_第一章_统计和数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 猎豹浏览器 自动填充功能
- 下一篇: 【深度学习】预训练语言模型-BERT