常用Stata命令(持续更新中)
生活随笔
收集整理的這篇文章主要介紹了
常用Stata命令(持续更新中)
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
為便于實(shí)際操作,筆者將命令與顯示結(jié)果存儲成do文件(直接可以在Stata軟件中查看,便于學(xué)習(xí)),移步資源窗口下載。
基本操作命令:
查看數(shù)據(jù):
browse #看到全部數(shù)據(jù)list q #只看到q的數(shù)據(jù)list q area in 4/10 #顯示指定變量從i=4到i=10的數(shù)據(jù)describe #查看數(shù)據(jù)集中的變量名單、標(biāo)簽summarize q #查看變量q的統(tǒng)計(jì)特征summarize q,detail #查看變量q更多的統(tǒng)計(jì)指標(biāo)summarize #若未指明變量,則顯示數(shù)據(jù)集中所有變量的統(tǒng)計(jì)指標(biāo)tabulate pl #顯示變量pl的經(jīng)驗(yàn)累積分布函數(shù)pwcorr pl pf pk,sig star(.05)#顯示變量pl、pf、pk之間的相關(guān)系數(shù),.05表示顯著性水平為5%I q farmm if q<=200 #顯示滿足條件的指定變量的數(shù)據(jù) #還可以設(shè)置多個(gè)條件,中間要用&連接輸入數(shù)據(jù):
cd G:\Stataex #指定默認(rèn)路徑 pwd #查看當(dāng)前路徑 import excel "G:\Stataex\expd.xls", sheet("sheet11") firstrow clear #輸入數(shù)據(jù) save "G:\Stataex\expanel.dta" #保存數(shù)據(jù) # 在 Stata中“/* */”、“*”表示對命令進(jìn)行注解,在Stata中不會被執(zhí)行調(diào)用數(shù)據(jù):
use G:\Stataex\expanel.dta,clear #打開指定路徑下的數(shù)據(jù)文件,這里的clear表示把之前的數(shù)據(jù)都清除掉。 shellout "auto.xls" #打開auto.xls, 注意要寫全后綴 import excel "auto.xls",sheet(domestic) #導(dǎo)入Excel數(shù)據(jù) label variable lnprice "ln(汽車價(jià)格-price)" #為變量lnprice添加標(biāo)簽 cls #清屏,stata16里的新功能顯示面板數(shù)據(jù)結(jié)構(gòu):
xtdescribe #顯示面板數(shù)據(jù)結(jié)構(gòu)顯示面板數(shù)據(jù)的統(tǒng)計(jì)特征:
xtsum q area provi year #可以查看多個(gè)變量(q,area,provi,year)的統(tǒng)計(jì)特征查看數(shù)據(jù)的分布頻率:
xttab q in 1/100 #查看前1到100個(gè)q的分布情況 多用于離散模型 #在此基礎(chǔ)上變形 xttab q if q<=100 #查看 q小于等于100時(shí)的分布頻率##在使用xttab命令時(shí),需要設(shè)置最大值 set maxsize * #在Stata/MP和Stata/SE中,允許的范圍:10< * < 11000 #Stata/IC中:10< * < 800 超過此范圍會報(bào)錯畫圖:
xtline q, overlay #表示在同一圖里,畫變量q的時(shí)間序列圖,否則,畫n個(gè)(n個(gè)個(gè)體)時(shí)間序列圖 histogram q,width(1000) frequency #變量q的直方圖 kdensity q #變量q的連續(xù)經(jīng)驗(yàn)分布圖/核密度函數(shù)圖 scatter tc q #tc與q之間的散點(diǎn)圖 twoway (scatter tc q)(lfit tc q) #散點(diǎn)圖上畫出回歸直線 twoway (scatter tc q)(qfit tc q) #散點(diǎn)圖上畫出二次回歸曲線 graph combine scatter1.gph scatter2.gph #將兩張圖并列排放在一張圖上 #scatter1,scatter2為事先生成圖的文件名 help histogram #查看對于該命令的詳細(xì)說明 #保存圖 graph save panel2 replace #表示將圖片保存至默認(rèn)路徑,將已存在的panel2替換掉生成新變量 (generate/gen/g):
gen lnq = log(g+farmm) g lnq = log(g+farmm) #虛擬變量的生成 qy的取值為1,2,3 1代表東部,2代表中部,3代表西部 g d_qy2=(qy==2) #如果是中部省,生成虛擬變量d_qy2=1,否則為0安裝第三方包:
ssc install st0085_2 #安裝第三方包 help esttab #找到esttab對應(yīng)的軟件包數(shù)據(jù)分析:
reg lnq lnarea lnfarmm, r #pool回歸 estimates store POOL11 #est sto POOL11 xtreg lnq lnarea lnfarmm lnagchf, fe vce(cluster provi) #個(gè)體固定效應(yīng)變截距模型--組內(nèi)估計(jì) est sto FE1 esttab POOL11 FE1, ar2(%8.4f) se(%8.4f) star(*0.1 **0.05 ***0.01) # esttab using test.doc, ar2(%8.4f) se(%8.4f) brackets aic bic mtitles esttab using test1.xls, ar2(%8.4f) se(%8.4f) brackets aic bic mtitles replace #默認(rèn)展示最近一次回歸的結(jié)果 # (%8.4f)表示數(shù)據(jù)保留小數(shù)點(diǎn)后4位有效數(shù)字 # star(*0.1 ** 0.05 *** 0.01) 顯著性水平--默認(rèn)也顯示 # barckets表示se放在中括號里--默認(rèn)是小括號 # ar2表示修正的R2--r2表示R2 # se表示標(biāo)準(zhǔn)誤 # aic、bic是信息準(zhǔn)則 # mtitles表示把POOL11、FE1作為標(biāo)題名,默認(rèn)是被解釋變量名 # using test1.doc表示將回歸結(jié)果保存至Word文檔變量重命名:
rename larg large #將larg重命名為large計(jì)算器功能:
display log(2) #計(jì)算log(2)的值線性回歸:
regress lntc lnq lnpl lnpk lnpf #對變量lntc lnq lnpl lnpk lnpf進(jìn)行回歸分析 vce #顯示估計(jì)系數(shù)的協(xié)方差矩陣 predict lntchat #計(jì)算被解釋變量的擬合值,并將其記為lntchat predict e1,residual #計(jì)算殘差,并將其記為e1自相關(guān)檢驗(yàn)
#DW檢驗(yàn):可檢驗(yàn)一階自相關(guān)(高階無效),在回歸后輸入 estat dwatson #LM檢驗(yàn): estat bgodfrey #1階自相關(guān)檢驗(yàn) estate bgodfrey,lags(2) #檢驗(yàn)幾階自相關(guān)就在括號內(nèi)輸入幾階異方差檢驗(yàn)(更新中)
在這里插入代碼片特殊情況的處理:
情況一:個(gè)體變量名非數(shù)值
例如,province 是個(gè)體變量名, year是時(shí)點(diǎn)變量名
(注:在運(yùn)行面板數(shù)據(jù)的相關(guān)命令前,要運(yùn)行下列命令)
第一步:
encode province, gen(id) #生成新變量ID(取值為1,2,3...)來替代province #若個(gè)體變量為1,2,3...整數(shù),就無需使用encoder命令第二步:
xtset id year #本命令相當(dāng)于告訴Stata, 該數(shù)據(jù)為面板數(shù)據(jù)以下命令慎用
drop farmm #刪除變量farmm drop if q<=2000 #刪除滿足條件的數(shù)據(jù) keep q area #僅保留q、area兩個(gè)變量總結(jié)
以上是生活随笔為你收集整理的常用Stata命令(持续更新中)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 路就在脚下,请勇敢的迈步。-----(对
- 下一篇: 用Python实现TXT文件分割