【金融量化】深度学习在金融中的研究热点以及应用
???
寫在前面
下面這篇文章的內容主要參考2020年最新發表的一篇綜述論文:《Deep Learning for Financial Applications : A Survey》。這篇論文主要圍繞深度學習在金融領域的最新的一些理論和實際應用成果進行了介紹,其中主要包括了深度學習在算法交易、風險管理、投資組合管理以及欺詐監測等領域的應該。特別地,該綜述共引用論文200多篇,如果對文中的某種方法感興趣,可以直接參考引用的原論文。論文的pdf可在文末進行獲取。
?
摘要
在過去的十幾年里,人工智能在金融領域已經成為學術界和金融業非常熱門的討論話題。如今也已經有了許多研究已經發表,并且產生了各種各樣的模型。同時,作為機器學習(ML)領域的一個應用更為強大的分支,深度學習(DL)最近也開始得到越來越多的關注,主要原因在于它比經典的機器學習模型的性能更好、泛化和擬合能力更強。目前DL已經有許多不同的實現,如MLP、CNN、LSTM等,而且廣泛的研究和拓展還在繼續。金融是DL模型開始受到關注的一個特殊領域,目前也有很多不錯的理論和實際的研究成果,這篇文章從不同角度展現了DL在金融領域的一些應用,可以為從事或者研究該領域的人員提供不錯的思路。
常見深度學習模型
深度學習屬于機器學習的范疇,只不過它是一種主要以深度神經網絡來對數據進行高層次抽象的模型。深度學習在金融中用到的模型主要包括下面幾種:
1. 多層感知機 (Deep Multi Layer Perceptron,?DMLP)
深度多層感知機是首先提出的一種深度神經網絡模型,它同多層感知機類似,包括輸入層、隱藏層和輸出層,只不過它要比多層感知機有更深的隱藏層數。通過增加隱層的深度,深度多層感知機相比于淺層結構具有更強的分類和回歸效果。對于深度多層感知機的訓練通常通過基于梯度的算法,如批量梯度下降、隨機梯度下降等進行訓練。深度多層感知機的結構以及向前計算與反向傳播如下圖所示:
2.?卷積神經網絡 (Convolutional Neural Networks, CNNs)
卷積神經網絡是圖像識別領域作為常用的深度學習技術,也于最近被用于金融領域,之前我也寫過幾篇推文就是通過CNN來做因子提取的用于構造選股模型的,感興趣的可以看一下解讀:將金融時間序列轉換為2-D圖像來構建交易系統和金工研報:利用卷積神經網絡進行多因子選股。一個典型的卷積神經網絡通常會包括卷積、過濾、池化以及全連接等操作,下圖展現了一個常見的卷積神經網絡結構。
3. 遞歸神經網絡 (Recurrent Neural Network, RNN)
遞歸神經網絡是最為常用的處理時序數據的深度學習方法,如金融時間數據、音頻數據。遞歸神經網絡根據輸入輸出序列的類型不同,又被分為了端到端、端到序列以及序列到序列的形式。另外,不同于深度神經網絡的反向傳播訓練方式,遞歸神經網絡的訓練是通過 Backpropagation Through Time (BPTT)。前面也有推送過通過RNN的介紹以及通過RNN進行股價預測的實現:如何用RNN進行股票價格預測。為了便于了解其訓練的過程,遞歸神經網絡通常會被展開,一個典型的遞歸神經網絡展開后的結構如下圖所示。
4. 長短期記憶網絡 (?Long Short Term Memory, LSTM)
長短期記憶網絡也是一種常用的深度學習架構,與RNN一樣,它也常用于時序數據分析。只不過不同于RNN在于,LSTM網絡具有門控結構,所以它的優勢在于它可以記住網絡的短期和長期記憶。每一個LSTM單元都包括輸入門、輸出門以及遺忘門,LSTM單元通過這三個門控制信息流。有了這些特性,每個單元可以在任意時間間隔內記住所需的值。常見的LSTM的單元結構如下圖所示。
5.?受限玻爾茲曼機 (Restricted Boltzmann?Machines, RBMs)
RBM是一種特殊的神經網絡模型,或者稱為一種隨機神經網絡模型,它的神經元的輸出只有兩種狀態(未激活、激活)。RBM可以從輸入數據中學習得到它的概率分布。RBM常被用于降維、分類以及特征學習。從結構上看,RBM是一種具有兩層結構的神經網絡,每個單元都是一個處理輸入的計算點。每個單元對輸入數據是否傳輸進行隨機決策。輸入乘以特定的權重,將某些閾值(偏差)添加到輸入值中,然后通過激活函數傳遞計算值。RBM的結構圖如下所示。
6. 深度信念網絡 (Deep Belief Networks, DBNs)
DBN是一種由RBM層堆疊起來的神經網絡,訓練時可通過從低到高逐層訓練這些RBM來實現。它的結構圖如下圖所示。
7.?自編碼器?(Autoencoders, AEs)
自編碼器是一種能夠通過無監督學習,學到輸入數據高效表示的人工神經網絡。輸入數據的表示的過程稱為編碼(codings),其結果的維度一般遠小于輸入數據,進而,使得到的更具有代表性的低維特征用于進一步的分類或者特征學習。因此自編碼器可用于降維或者特征提取。一個基本的自編碼器的結構如下圖所示:
8.?其他深度結構模型
除了前面提到的一些深度學習模型之外,還有一些較新的技術像深度強化學習(Deep Reinforcement Learning, DRL), 對抗神經網絡(Generative Adversarial Networks , GANs), 膠囊網絡(Capsule Networks), 深度高斯過程 (Deep Gaussian Processes, DGPs)等。由于這些技術在金融領域的應用還較少,所以在這篇文章進行統計時并沒有對這些方法的應用進行統計。然而,這并不意味著這些模型不適合金融領域。相反,它們為愿意付出更多努力想出新的解決方案的金融和深度學習社區的研究者和從業者提供了巨大的潛力。其中,尤其是深度強化學習,漸漸已經得到業界的關注,并且已經有一些理論上的成果了。
深度學習在金融領域中的應用
1.?算法交易(Algorithmic Trading)
這里的算法交易指的是完全通過智能模型來進行買賣決策,這些決策可能是基于一些簡單規則、數學模型、優化過程或者是機器學習和深度學習。將深度學習用于算法交易主要的研究最常見的是與一些時間序列價格預測的模型相結合,以達到進行市場擇時的目的,如通過LSTM、RNN等進行價格回歸;或者對市場的趨勢進行分類,以觸發買賣信號,如用DMLP、CNN進行因子選股或者趨勢分類;再或者也有一些研究獨立的算法交易模型,通過優化買賣價差、限制訂單分析、倉位大小等交易參數來關注交易本身的動態,如一些關于高頻交易、配對交易的研究。下面的三個表分別從這三個角度列舉了一些現有的應用。
2.?風險管理(Risk Assessment)
DL在金融領域研究的另一個領域是風險評估,即識別資產、公司、個人、產品、銀行等的風險。具體的一些應用如破產預測、信用評分、信用評估、貸款/保險承保、債券評級、貸款申請、消費信貸終止、企業信用評級、抵押貸款選擇決策、財務困境預測、企業危機預測等。在這種情況下,正確識別風險狀況是至關重要的,因為資產定價高度依賴于這些風險評估措施。大部分風險評估研究集中在信用評分和銀行困境分類上,然而,也有一些關于抵押貸款違約可能性、風險交易檢測和危機預測的應用。下面的兩個表按照這兩種類型進行列舉了一些DL的應用。
3. 欺詐檢測(?Fraud Detection)
金融欺詐是各國政府和機構努力尋找永久解決辦法的領域之一。一些常見的金融欺詐有信用卡詐騙、洗錢、消費信貸詐騙、逃稅、銀行詐騙、保險索賠詐騙等。這些也是機器學習研究中最廣泛研究的金融領域之一,并有很多相關的論文。在機器學習中,這些類型的研究大多可以看作是進行異常檢測或者看做是一個分類問題。
其中,一些研究像通過DL模型如MLP、LSTM等做信用卡欺詐檢測,通過AE做異常點檢測,應用于巴西選舉中的議會開支以及查明巴西公司在出口稅申報方面的財務欺詐和洗錢行為。下表中展現了一些DL模型用于欺詐監測的研究。
4.?投資組合管理(Portfolio Management)
投資組合管理是在一個預定的時期內選擇投資組合中各種資產的過程。包括投資組合優化、組合選擇、組合分配等。投資組合管理實際上是一個優化問題,識別在給定時期內選擇表現最好的資產的最佳收益可能的過程。因此,很多研究者開發了許多EA(進化算法)模型,以用于優化投資組合。目前也有很多將DL應用于投資組合管理的成果,像進行股票選股,例如有研究者根據預期收益將股票分為低動量和高動量兩類,使用一個深度RBM編碼分類器網絡,并取得了很高的回報。下表中展現了投資組合管理的一些DL實現與成果。
5. 定價模型以及衍生品市場(Asset Pricing and Derivatives Market)
資產的準確定價或估值是金融學的一個基礎研究領域。在銀行、企業、房地產、衍生產品等有很多ML模型。然而,DL還沒有應用到這個特殊的領域,但仍不可否認的,DL模型可以在一些可能實現的領域幫助資產定價研究人員或估值專家。例如期權定價、對沖策略開發、期權金融工程、期貨、遠期合約等研究都可以從開發DL模型中獲益。下表展現了一些現有的幾種DL模型在定價模型以及金融衍生品市場中的應用。
6.?加密貨幣以及區塊鏈(Cryptocurrency and Blockchain Studies)
在過去的幾年里,加密貨幣由于其難以置信的價格波動在短時間內一直人們所談論。盡管價格預測主導了主要的研究領域,但一些其他的研究也存在,如加密貨幣算法交易模型。同時,區塊鏈是一種新技術,它提供了一種分布式分散的賬本系統,很好地適應了加密貨幣的世界。事實上,加密貨幣和區塊鏈是高度耦合的,雖然區塊鏈技術有更大的跨度,各種實現可能性需要研究。它仍處于早期開發階段,因此還有很多潛力。一些關于加密貨幣研究的DL模型已經出現,主要是做價格預測或交易系統。現有的DL成果如下表所示。
7. 市場情緒分析和行為金融(Financial Sentiment Analysis and Behavioral Finance)
行為金融學最重要的組成部分之一是投資者情緒分析。最近,文本挖掘技術的進步為通過社交媒體提取大眾的投資情緒提供了可能性。人們對金融情緒分析越來越感興趣,尤其是將其用于趨勢預測和算法交易模型的開發。因此,目前利用DL模型進行情緒分析對金融預測是目前研究的熱點。例如有研究者利用路透社的新聞進行了情緒、情緒預測,并將這些情緒用于價格預測。也有研究者使用了情緒分類(中性、正面、負面)并通過LSTM對股票開盤價或收盤價進行了預測,結果與SVM進行了比較,得到了更高的整體性能。下表提供了關于情緒分析研究的一些信息,這些研究集中基于文本挖掘的金融預測。
8. 金融文本挖掘(Financial Text Mining)
隨著社交媒體的快速傳播和實時流媒體新聞的出現,基于文本的即時信息檢索成為了金融模型開發的工具。因此,近年來金融文本挖掘研究變得非常流行。雖然這些研究中有一些直接對大眾的情緒分析感興趣,但也有很多實現通過分析文本上下文對新聞、財務報表、披露等內容檢索感興趣的研究。其中,有研究者利用LSTM與遷移學習使用文本挖掘通過金融新聞和股票市場數據;也有研究者做過利用路透社、彭博社的財經新聞和股票價格數據預測未來的股票走勢。還有研究者通過Stock2Vec和TGRU模型從財經新聞和股票價格中生成輸入數據,用于股票價格的分類。下面三張表按照用DL做金融文本挖掘沒有情感分析預測、金融文本挖掘做情感分析預測以及其他金融文本挖掘的應用進行了列舉。
?
深度學習在金融領域中的當前研究熱點
對于深度學習在金融領域的研究熱點的探究,該論文對來自144個國際期刊中關于DL在金融領域應用的一些文章進行了統計,統計的角度包括文章的主題、發表類型、方法、數據集等。
下面兩張圖是這些論文中各個主題以及近20年的文章數量統計結果,從結果中可以看出金融領域文本挖掘以及算法交易發表的文章最多,并且最近三年發表的該領域的文章要占很大的比重,說明了隨著DL的發展,DL在金融領域的應用越來越受到關注。
下面的統計圖是關于發表的論文中所用到的基本模型類型的數量統計,從結果中可以看出,涉及到的最多的幾種模型是RNN、DMLP、CNN。RNN以及其拓展像LSTM、GRU等,作為用于分析時序數據的最為常用的深度學習模型,常被用于金融時間序列數據預測,所以常用于算法交易相關主題,同時它們也可用于處理自然語言,所以也常用于金融文本分析。
Python作為數據分析以及建模最為常用的語言,所以在下面的關于各種模型實現時用到的語言的統計中,Python自然占到了最大的比重,達到了80.1%。而Keras(現已合并為了Tensorflow中的子模塊)、Tensorflow以及Sklearn庫作為Python中最常用于深度學習建模以及數據分析和處理的庫,其使用率則占到了前三位,其次是一些基本科學計算以及數據分析庫像Numpy、Pandas,以及用于文本分析的常用庫jieba。
下面的圖展示了這些論文主要來自了哪些期刊,在這些期刊中所占的比重以及這些期刊所對應的的影響因子。其中,最為受到青睞的top期刊包括?Expert Systems with Applications, Decision Support Systems, Applied Soft Computing, Neurocomputing, Knowledge-based Systems。作為相關領域的科研人員也可以根據這些期刊文章接收的數量來抉擇和判斷自己文章以后要投的期刊。
?
一些討論和當前仍面臨的問題
在介紹了DL在金融領域的一些應用之后,下面是一些目前較為前沿的討論和對于將DL應用于金融領域中仍然比較開放的話題,主要是從DL模型以及其實現的角度進行了討論。
首先,由于LSTM對金融時間序列數據預測和處理的特性,以及從近些年的論文中所用到的模型的統計,可以看出LSTM是最受大多數研究人員青睞的主要DL模型。只要金融數據的時間性質保持不變,LSTM及其相關的拓展模型將保持其受歡迎性,然而現實的市場卻是分形的、多變的。除此之外,在過去的兩年里,基于CNN的模型開始在研究人員中得到更多的關注。與LSTM不同,CNN更適合于分類問題,更適合于非時變或靜態數據表示。但是,由于大多數金融數據是時變的,在正常情況下,CNN并不是金融應用的通常選擇。然而,在一些獨立的研究中,研究者創新性地將一維時變的金融數據轉化為二維大多平穩的類像數據,通過自適應濾波和隱式降維來利用CNN的能力,也可以發揮CNN強大的功能。另一個越來越受關注的模型是基于DRL,即深度強化學習的實現,特別是結合基于agent的建模方法,即讓模型自己在市場中探索,并尋求規律以實現對市場環境的自適應。
另外,在大多數論文中,混合模型比原生模型更適合取得更好的成績。也有許多研究人員通過配置網絡的拓撲結構和網絡參數以實現更高的性能。然而,還復雜的結構和更多的超參數,也意味著存在創建更復雜的混合模型的危險,這些模型不僅不容易構建,而且解釋它們也可能很困難。
除了前面介紹的使用DL模型實現的價格/趨勢預測和算法交易模型在金融領域的應用之外。DL研究人員對風險評估和投資組合管理方面的應用也是越來越感興趣。盡管對深度數據挖掘模型的廣泛興趣正在上升,但金融文本挖掘比大多數其他金融應用更引人注目。金融新聞、推文、博客的流媒體為金融社區打開了一個全新的世界,允許通過它們建立更好、更多功能的預測和評估模型,并將數字和文本數據整合在一起。如前面所看到的,目前一般的做法是將文本挖掘與金融情緒分析相結合。目前很多研究人員開始研究這個特定的應用領域,下一代表現優異的模型實現很可能基于能夠成功地將文本挖掘與可量化的數據集成在一起的模型。
該綜述在最后還整合一些Responses to Questions:
-
DL社區對哪些金融應用領域感興趣?
Response:金融文本挖掘、算法交易、風險評估、情緒分析、投資組合管理和欺詐檢測是金融研究中最受關注的領域。
-
這些應用領域的現有研究有多成熟?
Response:盡管DL模型在幾乎所有領域都比傳統模型取得了更好的成績,但在所有研究領域的整體興趣仍在上升。
-
從學術/工業研究的角度來看,哪些領域具有廣闊的潛力?
Response:加密貨幣、區塊鏈、行為金融學、高頻交易、衍生品市場等具有廣闊的研究前景。
-
在不同的應用中,哪種DL模型更受青睞(而且更成功)?
Response:基于RNN的模型(特別是LSTM)、CNN和DMLP在實現中被廣泛使用。從我們所遇到的情況來看,LSTM在時間序列預測中更成功,更受青睞,而DMLP和CNN更適合需要分類的應用。
-
DL模型如何對抗傳統的軟計算/ ML技術?
Response:在大多數研究中,DL模型比ML模型表現得更好。在一些情況下,ML有類似的甚至更好的解決方案,然而一般的趨勢是DL方法的性能優于其他的技術。
-
金融DL研究的未來方向是什么?
Response:在不久的將來,基于時空的數據表示、NLP、情感分析和基于文本挖掘的混合模型可能會變得更加重要。
?
結論
如今,金融業界和學術界已經開始認識到DL在各個應用領域的潛力。所以將DL應用于金融領域的研究工作逐年加速增長。然而,我們正處于這個新時代的早期,更多的研究將被實施,新的模式將不斷涌現。在這篇綜述論文中,詳細展現了當前最先進的一些DL研究在金融領域中的應用。這篇文章不僅提供了現有研究現狀的一個快照,而且還為相關領域的研究人員提供了一些未來的研究方向。
參考資料:
Deep Learning for Financial Applications : A Survey
關注《人工智能量化實驗室》公眾號,后臺發送030可獲取原論文。添加微信 codingquant,備注加群,加入人工智能量化微信交流群。
??
總結
以上是生活随笔為你收集整理的【金融量化】深度学习在金融中的研究热点以及应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Windows11镜像网盘链接
- 下一篇: MBTI人格测试