领域应用 | 从数据到智慧,知识图谱如何推动金融更智能?
本文轉載在公眾號:恒生技術之眼。
在《人工智能+知識圖譜:如何規整海量金融大數據?》一文中,筆者曾提到,面向人工智能的大數據治理,勢必能有效支撐智能金融從感知智能向認知智能變革。這是因為目前在資本市場中,大數據的治理存在一些問題,比如非結構化數據的處理與使用、實時敏捷的數據處理與使用以及多源異構的數據孤島等。
?
而知識圖譜在智能金融中扮演的正是數據加工、處理的角色,能夠為數據服務提供相應的支持。比如對于多源異構的數據,知識圖譜能做到比較好的集成,通過統一的數據表示與建模、統一數據處理與存儲來降低數據的使用難度。
?
正所謂“玉不琢不成器”,數據是金融的生命線,經過知識圖譜的“琢磨”,大數據治理會有更多成果呈現出來,從而更好地賦能智能金融,助力金融機構實現數據驅動下的業務運營和創新。那么想要達到這樣的目的,資本市場的知識圖譜應該如何構建呢?
資本市場知識圖譜構建的核心目標
?
有目標,才有方向。在資本市場中,人們都在關注資產的價格、走勢以及相關的分析,這是一個永恒的話題。所以資本市場知識圖譜的建立應該有兩個核心目標:
?
核心目標1:企業畫像&企業分析
?
以前,我們為企業做信息規整的時候,以集合企業的360度屬性信息為目標。而通過知識圖譜技術,我們可以改變這種思路,以企業為中心,把圍繞企業的實體關系建立起來,比如企業與企業的關系、企業與人的關系、企業與行業的關系、企業與輿情事件的關系、企業與宏觀要素的關系等等。當我們將企業放在關系網絡里,把種種關系都建立起來的時候,我們會發現,企業的畫像也就完成了。
?
企業分析也是從關系分析開始的。在關系網絡具備的情況下,我們可以以關系分析為起點進行企業的分析,一步步達到我們最終所需的分析目標和結果。
?
核心目標2:輿情事件基于知識圖譜的傳播
?
為企業做畫像,是相對靜態的一個結果,因為匯集的很多都是關于企業的靜態信息。而輿情事件在每天的新聞、公告、研報里都會發生,是相對動態的。那么輿情事件有沒有傳遞效應?有什么樣的傳遞效應?這也是我們在資本市場中構筑知識圖譜時需要考慮的。
?
資本市場知識圖譜構建的關鍵點
?
有了這兩個核心目標,資本市場的知識圖譜應該怎么構建呢?對于資本市場來說,知識圖譜的構建也需要知識建模、知識獲取、知識融合、知識存儲、知識展示、知識計算、知識應用等環節,這與傳統行業是一樣的。不一樣的地方在于以下幾個關鍵點:
?
場景驅動按需迭代
?
在金融行業,新的數據源源不斷地產生、匯集,那么我們在構建知識圖譜之時,需要以場景驅動來解決這個問題,在數據建模上不斷地更新,先建立Schema再去尋找相應的數據,集合起來之后對特定的應用場景提供相應的數據服務。隨著Schema 1.0、2.0、3.0不斷演化,一個企業級的知識圖譜可能就建立起來了。
?
充分利用第三方數據
?
起點不一樣,是資本市場知識圖譜與其他領域知識圖譜的一個不同點。在資本市場中,有很多第三方數據公司為證券公司、基金公司等金融機構提供數據服務,充分利用第三方數據對于知識圖譜的構建非常重要。這個起點有什么影響呢?一方面,第三方數據公司會通過自然語言處理等技術做一些數據的梳理工作,其數據結構質量會比較高,基于高質量數據來構建的知識圖譜,質量也會比較好,如果我們放棄這種方式,從大規模自動建立開始做,很難達到同等的效果;另一方面,第三方數據也是在不斷更新的,因此在知識獲取和知識融合方面,第三方數據可以幫我們解決冷啟動的問題。
?
事件與時序的支持
?
事件是相對動態的,動態的新聞、資訊對資產價格有非常大的影響,所以我們在資本市場的知識圖譜構建中,包括建模、分析、展示、存儲等各個環節,都要充分考慮到對事件和時序支持。
?
靈活的圖展示方式
?
資本市場的知識圖譜對于展示有一些不一樣的需求,比如可不可以按照產業鏈的方式把某一行業的上下游全部展示出來,能不能按照股權結構把實際受益人的圖譜關系展示出來等等,這些都是金融領域的圖展示需要做到的。
資本市場知識圖譜的應用場景
?
從數據的關系網絡支撐這個角度來看,知識圖譜作為數據治理的工具、手段,可以助力原有的傳統金融業務實現智能化的升級。另外,知識圖譜與機器學習等技術的結合,也會幫助原有的模型實現升級。那么具體來看,知識圖譜能夠對現在的金融業務產生哪些方面的賦能呢?
基礎賦能
▲基礎數據服務:把知識圖譜當做數據庫、知識庫,用KBQA(Knowledge Base Question Answering)的方式,為金融問答系統、智能客服系統以及金融智能搜索等業務提供相應的支持。
?
▲關系穿透/挖掘服務:知識圖譜對于關系穿透、挖掘的能力,使其非常適合找到一致行動人、實際控制人以及資本系挖掘,從而有助于關聯交易關聯賬號識別、信息批露等風控控制,并且能夠對風控風險的傳播和原因做深入分析,這在合規風控領域的應用有非常大的空間。
?
▲建模/推理服務:知識圖譜把一些關系的數據梳理得比較清楚,這對于營銷服務領域來說是一次革新的機會。無論從數據的提供層面,還是從模型的建立層面,知識圖譜在KYC/KYP(Know Your Customer / Know Your Product)、產品服務推薦、智能投顧等領域都會帶來非常大的價值。
進階賦能
▲基于知識圖譜事件傳播影響的智能資訊服務
?
這是靜態與動態知識圖譜能夠結合并產生金融服務的一個場景。目前對于頭部金融機構的終端服務來說,智能資訊已經是一種標配,可以把相應的資訊推送給相應的標的持有人,進行風險警示或投資機會提示。
?
在知識圖譜技術的加持下,智能資訊服務能夠做進一步的延伸,因為企業是處在關系網絡之中的,任何一個事件的傳遞都會沿著關系網絡傳播。比如“行業的原材料價格上漲”這樣一件事,會在企業的關系網絡里沿著企業的上下游來進行傳遞,據此我們可以把涉及到的相關企業從知識圖譜中找出來,命中事件傳播波動相關性標的、事件要素投研邏輯相關性標的等,從而對相應投資人進行相應標的的智能資訊服務,例如持倉/自選股預警、投顧等輔助服務。
?
▲基于知識圖譜的智能投研:分析師工作平臺
?
智能投研是知識圖譜能夠有較多應用的一個場景。每個行業分析師都有一套行業產業鏈邏輯,并且依據這套邏輯準確定位市場現狀、動態,預測并制作市場模型。借助知識圖譜,這套邏輯可以演化成一個投研工具,一個智能投研的分析平臺,滿足分析師私有化、個性化的要求,做到能夠自動添加實體(公司)、關系(產業鏈條)、屬性(私有數據),自定義投研邏輯與預警規則,幫助分析師進行產業鏈與企業關系的分析。
?
展望
?
在當下的智能金融時代,一方面我們需要著手進行面向人工智能的大數據治理,在數據層面上通過知識圖譜將原有的金融數據做再一次的加工、整理;另一方面,一個金融機構往往動輒幾十套、上百套系統,如何把知識圖譜等人工智能技術的服務能力開放給傳統的業務系統,進行面向人工智能的服務治理,這也是我們必須面對的一個挑戰。
此外,浙江大學陳華鈞教授曾提到過知識圖譜的數據源問題,由于數據太容易被復制了,一旦發生數據外泄很容易侵犯個人隱私與數據所有權,所以在知識圖譜領域,我們也可以考慮結合區塊鏈技術來對數據來源進行溯源。現在知識圖譜更多是集中式的,未來可能有更多分散式的知識圖譜架構出現,來幫助我們解決這個問題。
300多年,英國哲學家培根曾說,知識就是力量。而隨著人工智能時代的啟幕,我們或許也可以說:知識圖譜就是力量。知識圖譜起于搜索,又不止于搜索,它是底層的,是無處不在的,支撐著人工智能在各個場景中的應用。未來,知識圖譜必將讓金融更智能,在更多的金融業務場景中發揮更大的價值。
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的领域应用 | 从数据到智慧,知识图谱如何推动金融更智能?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 | 基于动态记忆的原型网络进行
- 下一篇: 论文浅尝 | 低资源文本风格迁移数据集