券商研报复现挑战赛|回望来时路,砥砺再出发
?
?
第一期的研報復現大賽已經落下帷幕啦~
再次感謝朋友們的踴躍參與和大力支持~
所有的匍匐都只是高高躍起前的熱身,
第二期的賽事即將開啟,我們期待您的參與!
?
?
第一期研報復現結果回顧
?
第一期研報復現比賽已經結束,通過15天的社區公開審核,綜合社區人氣指標進行評選,本次研報復現比賽的最終結果公布如下:
?
排名前三的作者分別是
?
>>> 1. 一夢春秋
>>> 2. lan666
>>> 3. k線放蕩不羈
?
在第一期的研報復現活動中收到了許多小伙伴們的投稿,也感受到了諸位量化愛好者的熱情,再次感謝各位小伙伴對本次比賽的支持與厚愛。
我們也希望通過這樣的活動,能夠傳遞基礎的量化研究方法、了解量化策略構建流程,能通過比賽任務的方式促進小伙伴們快速成長。
為此,我們調整了第二期的賽事規則,更多聚焦于研究思路與因子處理過程,任務內容也更加靈活。錯過了第一期比賽任務與未能取得滿意成績的小伙伴,不要灰心哦,第二期即將開始,敬請期待!
?
?
?
第一名研報作品展示
?
引言
?
>>> 研究目的
本文參考廣發證券《基于日內高頻數據的短周期選股因子研究-高頻數據因子研究系列一》,對研報構造的因子做了實現,并復現了里面的結果,做出了分析。其中用個股日內高頻數據構造選股因子,低頻調倉的思路是一個很好的方向。
?
>>> 研究內容
基于個股日內高頻數據,構建了已實現波動(Realized Volatility) ????,已實現偏度(Realized Skewness)?????、已實現峰度(Realized Kurtosis)?????因子指標,考察這三個因子在回測區間內對個股收益率 的區別度。
?
>>> 研究結論
在????三個因子中??偏度RSkewRSkew因??子最有效,分組區分度高,比較穩定,收益最高。
?
?
因子構建
?
因子構建過程摘自研報,具體因子指標構建如下:
1.對于每個個股在交易日t,首先計算個股在特定分鐘頻率下第i個的收益率
其中,pt,i表示在交易日t,個股在第i個特定分鐘頻率下的對數價格,pt,i-1表示在交易日t,個股在第i-1個特定分鐘頻率下的對數價格。
2.對于每個個股,根據??,?分別計算個股在交易日t下的已實現方差(Realized Variance) RDV art、已實現偏度(Realized Skewness)RDSkewt,已實現峰度(Realized kurtosis)RDKurtt。其中:
其中N表示個股在交易日t中特定頻率的分鐘級別數據個數,如在1分鐘行情級別下,數據個數N為60*4=240;在5分鐘行情級別下,數據個數N為240/5=48。
1.對于每個個股在交易日t計算累計已實現波動(Realized Volatility)RVolt,已實現偏度(Realized Skewness)RSkewt,已實現峰度(Realized Kurtosis)RKurtt,其中:
?
在每期調倉日截面上,按照上述公式計算每個個股的已實現波動(Realized Volatility)RVolt,已實現偏度(Realized Skewness)RSkewt,已實現峰度(Realized Kurtosis)RKurtt指標,針對每個由高頻數據計算得到的因子指標在歷史上的分檔組合表現,試圖尋找出相對有效的因子指標。
?
?
構造因子數據
?
>>> 計算因子值的過程比較慢,大概耗時1小時左右。如果直接下載我構造好的數據文件(factor_dict.pkl)上傳到研究里可以跳過這一步,直接到因子特征展示開始執行。
?
>>> 之后開始計算因子值。
?
?
因子特征展示
?
通過上文中的代碼,已經獲取到了中證500成分股2013-2019的因子數據。
以下分別從因子頻率分布、因子百分位走勢2個維度展示因子特征。
?
>>> 頻率分布
?
?
從以上因子分布三圖看出,整個A股市場個股的波動率分布整體上呈現右偏分布;個股的偏度分布,整體偏度水平保持在零附近,呈現較為明顯厚尾狀態;個股的峰度分布與個股波動率水平類似,分布整體上右偏,且樣本內個股的峰度水平大部分大于3,呈現厚尾的現象,和研報中的三個因子分布圖情況和結論相同。
?
>>> 百分位走勢
?
?
從以上三圖看出,個股的波動率在不同的時間維度上變化較大,當市場趨勢行情較明顯時候,個股波動率水平整體上呈現上升的趨勢;個股偏度水平整體較為穩定;個股峰度水平在極端行情下峰度更高,且不同分位數差異更加明顯。
和研報中的三個因子百分位走勢圖情況和結論相同。
?
?
實證分析
?
>>> 因子選股分檔表現
?
?
由以上累計收益率5檔圖看出,偏偏度RSkew因子分檔很明顯,單調性顯著;RVol因子分檔不明顯,峰度RKurt因子的區分度比偏度RSkew略微弱一些,但好于RVol因子。
和研報結論相同。
?
>>> 因子多空收益
?
?
從以上多空累計收益三圖可以看出,偏度RSkew因子多空收益最高,也比較穩定,基本上一直在上行,進一步驗證了RSkew因子的有效性。峰度RKurt因子在2013-2014年多空收益在0上下徘徊,和峰度RKurt因子分檔累計收益圖中2013-2014區分度不明顯情況相同。
?
>>> 因子分析
r_skew ic 小于0的個數占比:0.6600660066006601
r_kurt ic 小于0的個數占比:0.66996699669967
從以上IC三圖可以看出,偏度RSkew因子平均IC基本都小于0,且IC負值占比超過6成,預測能力較好。
偏度RSkew因子在中證500指數下2013-2019年IC小于0的個數占比為66%,和研報中中證500的IC統計結果近似。受限于研究的內存和因子構建執行時間,我沒有使用全市場數據計算,研報中全市場數據的IC小于0的個數占比未驗證。
?
>>> 因子換手率
這里不知道換手率統計的對不對。我只考慮了兩個調倉日之間,每個檔位更換股票占原股票的比例。偏度RSkew因子子的換手率比較穩定,基本上每期都要把持倉更換一遍。
看散點分布情況,換手率分布大部分在85%以上,考慮到時間選取和算法的不同,和研報中給出的平均80%換手率也算接近。
?
?
總結
本研究從因子分布和因子百分位走勢對因子特征做了展示,從累計收益率、多空收益、因子IC、換手率幾個角度做實證分析。
總的來說,本研究使用中證500指數2013-2019年的數據選股,對研報中的內容基本上都做了復現,得出結論:三個因子中偏度RSkew因子最有效,分組區分度高,比較穩定,收益最高。
點擊【閱讀原文】,查看更多內容~
總結
以上是生活随笔為你收集整理的券商研报复现挑战赛|回望来时路,砥砺再出发的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python 数组写txt_python
- 下一篇: 分享5款小众软件,大家按需下载