量化选股模型—多因子模型
多因子模型是應用最廣泛的一種選股模型,基本原理是采用一系列的因子作為選股標準,滿足這些因子的股票則被買入,不滿足的則賣出。
基本概念
?
舉一個簡單的例子:如果有一批人參加馬拉松,想要知道哪些人會跑到平均成績之上,那只需在跑前做一個身體測試即可。那些健康指標靠前的運動員,獲得超越平均成績的可能性較大。多因子模型的原理與此類似,我們只要找到那些對企業的收益率最相關的因子即可。
各種多因子模型核心的區別第一是在因子的選取上,第二是在如何用多因子綜合得到一個最終的判斷。
一般而言,多因子選股模型有兩種判斷方法,一是打分法,二是回歸法。
打分法就是根據各個因子的大小對股票進行打分,然后按照一定的權重加權得到一個總分,根據總分再對股票進行篩選。回歸法就是用過去的股票的收益率對多因子進行回歸,得到一個回歸方程,然后再把最新的因子值代入回歸方程得到一個對未來股票收益的預判,然后再以此為依據進行選股。
多因子選股模型的建立過程主要分為候選因子的選取、選股因子有效性的檢驗、有效但冗余因子的剔除、綜合評分模型的建立和模型的評價及持續改進等5個步 驟。
候選因子的選取
候選因子的選擇主要依賴于經濟邏輯和市場經驗,但選擇更多和更有效的因子無疑是增強模型信息捕獲能力,提高收益的關鍵因素之一。
例如:在2011年1月1日,選取流通市值最大的50支股票,構建投資組合,持有到2011年底,則該組合可以獲得10%的超額收益率。這就說明了在2011年這段時間,流通市值與最終的收益率之間存在正相關關系。
從這個例子可以看出這個最簡單的多因子模型說明了某個因子與未來一段時間收益率之間的關系。同樣的,可以選擇其他的因子,例如可能是一些基本面指標,如 PB、PE、EPS 增長率等,也可能是一些技術面指標,如動量、換手率、波動等,或者是其它指標,如預期收益增長、分析師一致預期變化、宏觀經濟變量等。
同樣的持有時間段,也是一個重要的參數指標,到底是持有一個月,還是兩個月,或者一年,對最終的收益率影響很大。
選股因子有效性的檢驗
一般檢驗方法主要采用排序的方法檢驗候選因子的選股有效性。例如:可以每月檢驗,
具體而言,對于任意一個候選因子,在模型形成期的第一個月初開始計算市場中每只正常交易股票的該因子的大小, 按從小到大的順序對樣本股票進行排序,并平均分為n個組合,一直持有到月末,在下月初再按同樣的方法重新構建n個組合并持有到月末,每月如此,一直重復到模型形成期末。
上面的例子就已經說明了這種檢驗的方法,同樣的可以隔N個月檢驗,比如2個月,3個月,甚至更長時間。還有一個參數是候選組合的數量,是50支,還是100支,都是非常重要的參數。具體的參數最優的選擇,需要用歷史數據進行檢驗。
有效但冗余因子的剔除
不同的選股因子可能由于內在的驅動因素大致相同等原因,所選出的組合在個股構成和收益等方面具有較高的一致性,因此其中的一些因子需要作為冗余因子剔除, 而只保留同類因子中收益最好,區分度最高的一個因子。例如成交量指標和流通量指標之間具有比較明顯的相關性。流通盤越大的,成交量一般也會比較大,因此在選股模型中,這兩個因子只選擇其中一個。
冗余因子剔除的方法:假設需要選出k 個有效因子,樣本期共m 月,那么具體的冗余因子剔除步驟為:
(1)先對不同因子下的n個組合進行打分,分值與該組合在整個模型形成期的收益相關,收益越大,分值越高
(2)按月計算個股的不同因子得分間的相關性矩陣;
(3)在計算完每月因子得分相關性矩陣后,計算整個樣本期內相關性矩陣的平均值
(4)設定一個得分相關性閥值 MinScoreCorr,將得分相關性平均值矩陣中大于該閥值的元素所對應的因子只保留與其他因子相關性較小、有效性更強的因子,而其它因子則作為冗余因子剔除。
綜合評分模型的建立和選股
綜合評分模型選取去除冗余后的有效因子,在模型運行期的某個時間開始,例如每個月初,對市場中正常交易的個股計算每個因子的最新得分并按照一定的權重求得所有因子的平均分。最后,根據模型所得出的綜合平均分對股票進行排序,然后根據需要選擇排名靠前的股票。例如,選取得分最高的前20%股票,或者選取得分最高的 50 到 100 只股票等等。
舉個例子:可以構建一個多因子模型為(PE,PB,ROE),在月初的時候,對這個幾個因子進行打分,然后得分最高的50個股票作為投資組合,在下個月按照同樣的方法進行輪換替換。持續一段時間后,考場該投資組合的收益率是否跑贏比較基準,這就是綜合評分模型的建立和后驗過程。
當然這個例子是一個最簡單的例子,實戰中的模型可能會比較復雜,比如沃爾評分法就是一個復雜的多因子模型,它是對股票進行分行業比較,算個每個行業的得分高的組合,然后再組合成投資籃子。
模型的評價及持續改進
一方面,由于量選股的方法是建立在市場無效或弱有效的前提之下,隨著使用多因子選股模型的投資者數量的不斷增加,有的因子會逐漸失效,而另一些新的因素可能被驗證有效而加入到模型當中;另一方面,一些因子可能在過去的市場環境下比較有效,而隨著市場風格的改變,這些因子可能短期內失效,而另外一些以前無效的因子會在當前市場環境下表現較好。
另外,計算綜合評分的過程中,各因子得分的權重設計、交易成本考慮和風險控制等都存在進一步改進的空間。因此在綜合評分選股模型的使用過程中會對選用的因子、模型本身做持續的再評價和不斷的改進以適應變化的市場環境。
多因子的模型最重要是兩個方面:一個是有效因子,另外一個是因子的參數。例如到底是PE有效還是ROE有效;到底是采用1個月做調倉周期還是3個月做調倉周期。這些因子和參數的獲取只能通過歷史數據回測來獲得。但是在回測過程中,要注意,不能過度優化,否則結果可能反而會不好。
影響股價走勢的主要因子包括市場整體走勢(市場因子,系統性風險)
估值因子(市盈率、市凈率、市銷率、市現率、企業價值倍數、PEG等)
成長因子(營業收入增長率、營業利潤增長率、凈利潤增長率、每股收益增長率、凈資產增長率、股東權益增長率、經營活動產生的現金流量金額增長率等)
盈利能力因子(銷售凈利率、毛利率、凈資產收益率、資產收益率、營業費用比例、財務費用比例、息稅前利潤與營業總收入比等)
杠桿因子(負債權益比、資產負債率等)
動量反轉因子(前期漲跌幅等)
交易因子(前期換手率、量比等)
規模因子(流通市值、總市值、自由流通市值、流通股本、總股本等)
股價因子(股票價格)
紅利因子(股息率、股息支付率)
股價波動因子(前期股價振幅、日收益率標準差等)
市場預期因子(預測凈利潤增長率、預測主營業務增長率、盈利預測調整等)。
拓展閱讀:
1.一個量化策略師的自白(好文強烈推薦)
2.市面上經典的量化交易策略都在這里了!(源碼)
3.期貨/股票數據大全查詢(歷史/實時/Tick/財務等)
4.干貨| 量化金融經典理論、重要模型、發展簡史大全
5.從量化到高頻交易,不可不讀的五本書
6.高頻交易四大派系大揭秘
?
?
總結
以上是生活随笔為你收集整理的量化选股模型—多因子模型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: asp.net网上零食销售商城系统
- 下一篇: 一个设计项调另一个设计项(支持多选传值)