年龄和收入对数的线性回归_(CFA教材详解)数量分析:线性回归模型的规范及常见错误...
更多CFA官方教材詳解,請關(guān)注“邊際實驗室”。
“邊際實驗室”是一家專注于金融科技、金融大數(shù)據(jù)領(lǐng)域的工作室,同時提供CFA、FRM等金融考試內(nèi)容的免費講解。
每當(dāng)我們估計回歸模型時,都必須假定回歸具有正確的函數(shù)形式。該假設(shè)可能會有以下幾種錯誤:
■可以從回歸中忽略一個或多個重要變量。
■在估計回歸之前,可能需要轉(zhuǎn)換一個或多個回歸變量(例如,通過對變量取自然對數(shù))。
■回歸模型匯集了來自不同樣本中不應(yīng)該被匯集的數(shù)據(jù)。
首先,考慮從回歸中忽略一個重要的自變量的影響(遺漏變量偏差)。如果真正的回歸模型是:
Yi= b0 + b1X1i + b2X2i +εi
但是我們估計的模型是:
Yi= a0 + a1X1i +εi
那么我們的回歸模型將被錯誤指定。該模型有什么問題?如果省略的變量(X2)與其余變量(X1)相關(guān),則模型中的誤差項將與(X1)相關(guān),并且回歸系數(shù)a0和a1的估計值將有偏差且不一致。另外,這些系數(shù)的標(biāo)準(zhǔn)誤估計值也將不一致,因此我們既不能使用系數(shù)估計值也不能使用估計的標(biāo)準(zhǔn)誤差來進(jìn)行統(tǒng)計檢驗。 案例遺漏變量偏差和買賣價差
在本例中,我們擴(kuò)展了對買賣價差的研究,以顯示從回歸中省略重要變量的影響。在此前的案例中,我們證明了[(買賣價差)/價格]的自然對數(shù)與做市商數(shù)量的自然對數(shù)和公司市值的自然對數(shù)存在顯著相關(guān)。
下表顯示了結(jié)果:
如果我們?nèi)コ兄档淖匀粚?shù),只對[(買賣價差)/價格]的自然對數(shù)與做市商數(shù)量的自然對數(shù)進(jìn)行一個自變量的回歸,結(jié)果如下表所示。
請注意,ln(納斯達(dá)克做市商數(shù)量)的系數(shù)從原始回歸(正確結(jié)果)的-1.5186變?yōu)殄e誤的-3.1027。同樣,截距從原始回歸中的1.5949變?yōu)?.0707。這些結(jié)果說明,遺漏回歸中應(yīng)包含的自變量會導(dǎo)致其余回歸系數(shù)的不一致。
回歸模型發(fā)生錯誤指定的第二個常見原因是,對于需要轉(zhuǎn)換的數(shù)據(jù),在回歸中沒有進(jìn)行轉(zhuǎn)換,或使用了錯誤的數(shù)據(jù)形式。例如,有時分析人員無法判斷因變量和自變量之間的非線性關(guān)系,進(jìn)而指定了變量之間的線性關(guān)系。在指定回歸模型時,應(yīng)考慮經(jīng)濟(jì)理論是否暗示了非線性關(guān)系。我們通常可以通過繪制數(shù)據(jù)圖表來確認(rèn)非線性關(guān)系,如下面的案例所示。如果當(dāng)一個或多個變量的比例變化表現(xiàn)出線性關(guān)系時,我們可以通過取自然對數(shù)來對錯誤指定進(jìn)行糾正。在其他時候,分析師更傾向于使用無單位的數(shù)據(jù)進(jìn)行回歸分析(例如將凈收入或現(xiàn)金流量除以銷售額)。在此前的案例中,我們用股票價格對買賣差價進(jìn)行了除法計算,因為對于投資者而言,買賣差價在交易成本方面的意義取決于股票價格;如果我們沒有調(diào)整買賣差價,那么回歸模型就會發(fā)生錯誤指定。
案例 非線性與買賣價差
在此前的案例中,我們的結(jié)果表明[(買入-賣出價差)/價格]的自然對數(shù)與做市商數(shù)量的自然對數(shù)和公司市值的自然對數(shù)均顯著相關(guān)。但是,為什么我們在回歸中使用的是變量的自然對數(shù)呢?
關(guān)于[(買入-賣出點差)/價格]及其決定因素(自變量)之間的關(guān)系的性質(zhì),有什么理論基礎(chǔ)嗎?Stoll(1978)建立了市場中買賣差價百分比決定因素的理論模型。他的模型如下:
其中,c是常數(shù)。在初始變量中,買賣差價百分比與做市商數(shù)量與市值的關(guān)系不是線性的。但是,如果對上述模型等式兩邊取自然對數(shù),轉(zhuǎn)換后的變量是線性的(對數(shù)-對數(shù)回歸):
Yi= b0 + b1X1i + b2X2i +εi
其中
Yi= 股票i(買入-賣出價差)/價格的自然對數(shù)
b0= 常數(shù),ln(c)
X1i= 股票i的做市商數(shù)量的自然對數(shù)
X2i= 公司i市值的自然對數(shù)
εi= 殘差
如此前案例所述,對數(shù)-對數(shù)模型的斜率系數(shù)被解釋為彈性,準(zhǔn)確地說,因變量相對于自變量存在部分彈性(“部分”是指保持其他自變量不變)。
我們可以繪制數(shù)據(jù)以評估對數(shù)轉(zhuǎn)換后變量是否線性相關(guān)。例如,下圖展示了一個股票的做市商數(shù)量自然對數(shù)的散點圖(X軸)、(買賣價差)/價格的自然對數(shù)(Y軸)及回歸線。這兩個經(jīng)過轉(zhuǎn)換后的變量之間的關(guān)系顯然是線性的。
如果我們不取[(買賣價差)/價格]的對數(shù),回歸線就不是線性的。上面第二張圖顯示了做市商數(shù)量自然對數(shù)(X軸)和[(買賣價差)/價格](Y軸)之間的關(guān)系。我們看到這兩個變量之間的非線性關(guān)系非常明顯的。因此,我們不應(yīng)該以[(買賣價差)/價格]為因變量來估計回歸。另外,考慮到需要確保預(yù)測的買賣價差是正的,因此我們不能直接使用[(買賣價差)/價格]作為因變量。如果我們直接使用[(買賣價差)/價格]作為因變量,模型也可以將買賣價差預(yù)測為負(fù)值。這個結(jié)果是荒謬的——在現(xiàn)實中,沒有買賣價差是負(fù)的(交易員不可能同時在高位買入和低位賣出),因此能夠預(yù)測買賣價差為負(fù)的模型肯定是錯誤的。我們下面將討論預(yù)測買賣價差為負(fù)值的問題。
下表顯示了以[(買賣價差)/價格]為因變量,做市商數(shù)量的自然對數(shù)和公司市值的自然對數(shù)為自變量的回歸結(jié)果。
1、假設(shè)對于在納斯達(dá)克上市的特定股票,做市商的數(shù)量為50,市值為60億美元。根據(jù)上述模型,該股票的預(yù)期買賣差價與價格的比率是多少?
做市商數(shù)量的自然對數(shù)等于ln50 = 3.9120,股票市值(百萬美元)的自然對數(shù)等于ln6000 = 8.6995。
在這種情況下,預(yù)期買賣差價與價格的比率為0.0674+(-0.0142×3.9120)+(-0.0016×8.6995)=-0.0021。因此,該模型預(yù)測買賣價差與股票價格之比為-0.0021。
2、上述股票的預(yù)期買賣價差是否有意義?如果沒有,如何避免這個問題?
預(yù)測的買賣差價為負(fù),這在經(jīng)濟(jì)上沒有意義。
通過使用[(買賣價差)/價格]的對數(shù)作為因變量,可以避免此問題。
通常,分析師在比較公司之間的數(shù)據(jù)之前必須決定是否對變量進(jìn)行加工。例如,在財務(wù)報表分析中,分析師通常會使用百分比財務(wù)報表。在百分比利潤表中,所有金額都除以了公司的收入。
百分比財務(wù)報表使公司之間的可比性更加容易。對于想要使用回歸分析來比較一組公司業(yè)績的分析師來說,可能會出現(xiàn)可比性問題。如以下案例所示。
案例 經(jīng)營現(xiàn)金流和自由現(xiàn)金流之間的關(guān)系
假設(shè)有一位分析師想解釋美國11家服裝公司2001年自由現(xiàn)金流與經(jīng)營現(xiàn)金流量的關(guān)系。
為了調(diào)查此問題,分析師可能在線性回歸中將自由現(xiàn)金流作為因變量,將經(jīng)營現(xiàn)金流作為自變量。下圖顯示了回歸的結(jié)果。請注意,經(jīng)營活動現(xiàn)金流的斜率系數(shù)的t統(tǒng)計量非常高(6.5288),回歸的F統(tǒng)計量的顯著性水平很低(0.0001),R方值非常高。我們可能會傾向于認(rèn)為這種回歸是準(zhǔn)確的。如果經(jīng)營活動現(xiàn)金流增加1.00美元,我們可以有把握地預(yù)測公司的自由現(xiàn)金流量將增加0.3579美元。
但是這個估計是正確嗎?該回歸沒有考慮樣本中公司之間的規(guī)模差異。
我們可以通過使用常見的現(xiàn)金流百分比結(jié)果來解決規(guī)模差異。在使用回歸分析之前,我們將經(jīng)營活動現(xiàn)金流和公司的自由現(xiàn)金流除以公司的銷售額。我們將(自由現(xiàn)金流/銷售額)作為因變量,并使用(經(jīng)營活動現(xiàn)金流/銷售額)作為自變量。下圖顯示了回歸結(jié)果。請注意,(經(jīng)營活動現(xiàn)金流/銷售額)斜率系數(shù)的t統(tǒng)計量為1.6262,在0.05水平上不顯著。另外,F統(tǒng)計量的顯著性水平為0.1383,因此我們不能在0.05水平上拒絕“回歸不能解釋服裝公司(自由現(xiàn)金流/銷售額)的差異”該假設(shè)。
最后,我們也應(yīng)該注意到,此回歸中的R方比以前的回歸低得多。
哪種回歸更有意義?通常,等比例的回歸更有意義。我們想知道如果來自經(jīng)營活動的現(xiàn)金流量(與銷售額的比率)發(fā)生變化,自由現(xiàn)金流(與銷售額的比率)會發(fā)生什么。如果不進(jìn)行縮除法,則回歸結(jié)果可以僅基于公司之間的規(guī)模差異,而不是基于公司的基本經(jīng)濟(jì)狀況。
回歸模型中錯誤指定的第三種常見形式是合并不應(yīng)合并的來自不同樣本的數(shù)據(jù)。我們用圖形方式說明這種類型的錯誤指定。下圖顯示了變量X和Y的兩個數(shù)據(jù)集,并帶有擬合的回歸線。數(shù)據(jù)可以表示兩個不同時間段的兩個金融變量之間的關(guān)系。
在X和Y的每個數(shù)據(jù)集中,兩個變量之間的相關(guān)性幾乎為0。由于組合樣本中兩個數(shù)據(jù)集的X和Y的均值不同,所以X和Y高度相關(guān)。然而,這種相關(guān)性是假的,因為它反映了X和Y在兩個不同時期的關(guān)系的差異。
本文由邊際實驗室自媒體原創(chuàng),如需轉(zhuǎn)載請務(wù)必注明出處!
總結(jié)
以上是生活随笔為你收集整理的年龄和收入对数的线性回归_(CFA教材详解)数量分析:线性回归模型的规范及常见错误...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 线段树(单点更新(模板)) 之 hdu
- 下一篇: 语言统计学中的几个定律,可作为设计检索的