我们的实践: 400万全行业动态事理图谱Demo
歷史經驗知識在未來預測的應用
華爾街的獨角獸Kensho,是智能金融Fintech的一個不得不提的成功案例,這個由高盛領投的6280萬美元投資,總融資高達7280萬美元的公司自推出后便名聲大噪。Warren是kensho是一個代表產品,用戶能夠以通俗易懂的英文來詢問Warren金融問題,例如“當三級颶風襲擊佛羅里達州時,哪支股票上漲得最快?”在回答這個問題的時候,它會在后臺強大的全球歷史事件庫中進行檢索,并直接給出直接的答案,這是國外智能投研的一個成功例子。就這種內部實現而言,Warren內部本身具有復雜的事件和數據分析模型,囊括全世界上億條事件的歷史事件庫為用戶提到的問題提供了很好的支撐。
實際上,這種基于歷史事件庫對現有事件進行影響和事件預測的方式值得我們借鑒,通過大規模挖掘領域事理圖譜,可以基于過往事件發生的結果,進一步對未來的事件進行預測,這個在金融領域中有大量的運用。例如,在進行行業研究時,往往需要考慮不同的事件對識別風險,發現潛在價值的風險,評估造成的影響。正所謂陽光底下無新事,歷史總是相似的。通過總結過去歷史經驗,可以為未來相似事件提供預測上的幫助。而回到歷史經驗這個概念,如何表示這種歷史經驗?如何使得這種歷史經驗能夠被計算機所理解?如何使這種歷史經驗具備可計算性?如何使這種歷史經驗能夠更具備抽象和泛化能力?一方面,這些問題都對現有的知識模型提出了需求,另一方面,這些問題都可以歸結成一種機器智能中的預測問題。
以事件作為實體節點單元的行業領域事理圖譜是實現以上預測問題的一個切入點。雖然受限于數據來源的可靠性、邏輯抽取的準確性,事理圖譜的準確度難以與分析師的邏輯進行匹敵,但事理圖譜的優勢在于,分析師收集的事件具有局部性,很難做到綜合全球各大事件;分析師收集的數據難以進行量化,不同分析師對事件的判斷偏差較大。
為了給分析師以及其他行業人員提供領域和常識性的事件推理歷史經驗庫,我們推出了商品金融事理圖譜。我們構建起了2000萬的歷史多行業資訊庫,總結出上百種因果事件模式。基于顯式因果模式,我們經過事件標準化、事件對齊、事件融合等處理后,最終形成了具有動態更新能力的多行業領域事理圖譜,事理圖譜Demo地址:http://39.106.1.94:8080(請復制到PC瀏覽器中打開),歡迎大家使用,并提出寶貴意見。有任何意見,可聯系本文作者huanyong@iscas.ac.cn。
全行業動態事理圖譜
1、平臺地址:http://39.106.1.94:8080(請在PC瀏覽器中打開)
2、平臺首頁:進入該平臺地址后,可以進入本demo的首頁,首頁如下,目前主要包括輸入框、推薦搜索、提示、圖譜展示區、聯系備注信息、節點類型標示等幾個區域。
圖1
3、待查詢事件的輸入。本圖譜收錄的資訊為全行業,因此可以支持多領域的事理邏輯查詢。用戶輸入的事件可以是一個表示具體動作的事件,可以是一個詞,一個短語,也可以是一句話。如金融領域的“降準”、“通脹”;時事領域的“特朗普和金正恩吵架”“感冒”等;汽車領域的“剎車失靈”、“汽油價格上漲”,如醫療領域中的“感冒”、“失眠”,生活領域的“心情煩悶”、“情緒激動”等,娛樂領域的“劉強東性侵案”、“崔永元炮轟范冰冰等”。搜索框下,列舉了幾個推薦搜索例子,用戶可以點擊使用。
4、事理圖譜的返回。當用戶輸入待查詢事件之后,系統會在后臺的事理圖譜中進行事件查詢,系統后臺會返回一個與該事件最相近的事件,主要包括兩類情況,一個是沒有找到最為相似的事件,返回空結果,具體表示成一個紅色的核心事件節點。另一個是找到若干個相似事件,這時返回三層的事理邏輯關系,以核心事件為中心,第二層為與第一層相似的事件,第三層為第二層事件所造成的影響事件。
5、事理圖譜的構成。事理圖譜中主要有節點和邊兩個元素組成,其中節點分成核心事件節點(紅色節點)、原因事件節點(粉色節點)、結果影響節點(藍色節點),關系邊主要包括相似邊和因果關系邊兩種,其中因果關系邊由來源的因果模式來標記,如“導致”、“因為-所以”、“由于-導致”等。
6、事理圖譜的擴展與回退。如圖中的”提示“所示,點擊圖譜末節點可以繼續展開下級節點,進入一個擴展模式,用戶可以通過不斷的點擊,進行因果事件鏈條的不斷擴展,若該因果事件沒有結果事件時,界面會提示沒有影響事件。同樣,用戶可以通過點擊上層事件,完成事件的回縮。
7、事理圖譜的縮放和拖動。為了增強用戶的體驗感,本圖譜提供圖譜的縮放和拖動功能,用戶可以通過拖動和縮放,完成對整個圖譜的全局和局部探索。
8、使用反饋。為了更好的提升用戶體驗以及發現我們的不足,歡迎大家使用并提出寶貴意見,有任何意見,請發送郵箱至huanyong@iscas.ac.cn
多領域事理圖譜的檢索
1、地緣政治的影響邏輯:“特朗普金正恩吵架”與“美國攻打伊拉克”
“美朝關系”是當今時代中最重要的主題之一,朝鮮核危機、朝韓關系、美朝關系的走向無不對全球的政治、軍事、經濟形勢都能造成重要的影響。朝鮮最高領導人和美國總統特朗普在2018年之間的關系發生了從口角向會談的戲劇性轉變,這種轉變的背后,有響應的邏輯影響在進行著。 我們以“特朗普金正恩吵架”為輸入事件進行探索,可以得到圖2的結果:
圖2
從圖中我們可以看到,事件圖譜中沒有找到與“特朗普與金正恩吵架”字符完全一致的事件,而是運用事件相似度計算返回了與該事件最為相似的事件表述“特朗普與金正恩唇槍舌戰”,該事件直接導致了“美國朝鮮局勢更為緊張”。在得到這一個結果事件之后,我們可以繼續往下探索,點擊“美國朝鮮局勢更為緊張”節點之后,系統進一步返回與該事件相似的事件,包括“朝鮮緊張局勢”、“美國朝鮮局勢緊張”、“朝鮮半島局勢更為緊張”、“朝鮮半島局勢緊張”等相似事件,通過這些相似事件可以進一步得到二度的影響結果。如“朝鮮緊張局勢”這一事件,會導致“全球股市走低”這一事件,點擊“全球股市走低”,進一步得到“證券公司盈利下降”、“股票基金縮水嚴重”等結果事件。又如“美國攻打伊拉克”這一地緣政治事件,能夠導致“國際油價上漲”、“伊朗原油供應中斷”等事件。
圖3
當然,圖2、3展示的只是一部分的圖譜內容,事實上可以在此基礎上進一步拓展。從以上的結果上可以看出,從兩個國家領導人之間的關系互動,其實可以牽扯出許多的經濟影響,這說明收集起來的事理圖譜可以進一步對地緣政治對經濟的影響進行有趣、一定程度的刻畫。
2、自然災害影響邏輯:“智利地震”與“多雨雪天氣”
地質災害是人類的天敵,由于地球內部的構造和運動,總是會不時的發生“地震“、“洪水”等地址災害。在經濟全球化的今天,國家與國家之間的經濟貿易往來不斷擴大,一個國家發生重大事件往往會給另外一些國家帶來深刻的影響,例如地質災害在給國家帶來經濟損失的同時,也會造成一系列的鏈式反應。2010年智利發生了8.8級大地震,這一地震帶來多種影響,我們以“智利地震”作為事件進行檢索,得到圖4結果。與上一段中提到的檢索方法相彷,我們找到了與用戶檢索事件“智利地震”相關的一些事件,包括:“智利地震”、“智利發生地震”、“智利大地震”等事件,通過相似事件,我們可以得到相應產生的影響結果,包括“有色金屬上漲”、“銅市場緊張”、“高檔魚粉價格上漲”等一度結果,通過拓展的方式,影響的事件可以進一步延長,后期可以看到“滬期鋅主力走高”、“大盤企穩回升”等結果事件。從這些事件中,我們可以進一步總結出一些常識性經驗,即智利是世界重要的產銅和魚粉大國,智利地震對智利的銅出口會造成一定影響,而“銅”同屬的有色金屬板塊,在實際的運轉過程當中,會出現聯動的效果。這些原本只有專業人士的知識,通過圖譜可以很好的展示出來。
圖4
此外,再以“多雨雪天氣”為例,從圖中,我們可以看到,“多雨雪天氣”下會造成“交通受限”、“運輸受阻”、“蔬菜產量減少”等不利結果,基于這些結果,可進一步得到更深更遠層次的事理邏輯。
圖5
3、健康生活影響邏輯:“經常熬夜”與“過度飲酒”
健康的生活往往是健康身體的根本保證,這是大家都心知肚明的事情,然而在實際的生活當中,我們總會因為這樣那樣的原因,將自己的身體放在一個亞健康的軌道上運行。熬夜、飲酒、是當前年輕人中普遍存在的一種亞健康生活方式,而這種亞健康方式到底會造成怎樣的影響呢?我們分別以“經常熬夜”、“過度飲酒”為檢索項進行檢索,得到以下部分結果。從“經常熬夜”這個事理圖譜的結果來看,“經常熬夜”將會導致“身體內熱上升”、“身體內分泌失調”、“女性內分泌失調”等不良的身體后果,而“身體內分泌失調”對于男同胞而言,又會進一步導致“男性精子數量減少”、“男性生育能力下降”等不良結果,這給我們廣大男同胞敲響了警鐘。
圖6
又如“過度飲酒”這個事件,“過度飲酒”無論在身體還是在經濟上都會帶來不良的影響,“過度飲酒”會造成“嚴重的個人消費負擔”、“日益突出的健康問題”、“中樞神經系統中毒”、“高血壓”等,而“高血壓”又將進一步導致“腎臟功能衰竭”等。這一系列的問題,都能夠為我們揭示出這一個“不良生活方式”下所牽扯并造成出的一系列壞處。
圖7
4、國家政策的影響邏輯:“降準”與“一帶一路”
改革開放40年來,我國取得了舉世矚目的經濟成就,而伴隨著改革開放的不斷深入,我們國家在國內宏觀調控和對外經濟政策上也會根據當前的經濟形勢而發生改變。2013年我國提出了“一帶一路”發展戰略,為進一步推動全球經濟發展做出了巨大貢獻,今年10月,我國央行提出了“降準”政策,這對國內經濟也帶來一定影響。我們以“降準”和“一帶一路政策”為例,在事理圖譜中進行查詢,得到以下結果:
圖8
從圖中可以看出,“降準”這一事件引發“資金外流”、“匯率貶值”、“人民幣下行”等一系列影響,匯率貶值資本外流又進一步引起“外匯儲備驟降”等進一步影響事件。下圖展示了“一帶一路政策”下的影響事件鏈條,“一帶一路政策”相關的事件包括“一帶一路政策升溫”、“一帶一路政策落地”、“一帶一路政策走向”等事件,這些事件都帶來一些利好影響,包括“訂單上行”、“公司產能漸次釋放”、“周邊經濟環境向好”、“業績成長確定性較高”。
圖9
總結
通過大規模挖掘領域事理圖譜,可以基于過往事件發生的結果,進一步對未來的事件進行預測,這個在金融領域中將有大量的應用。我們構建起了2000萬的歷史多行業資訊庫,總結出上百種因果事件模式。基于顯式因果模式,我們經過事件標準化、事件對齊、事件融合等處理后,最終形成了具有動態更新能力的多行業領域事理圖譜。本文介紹了我們開發的事理圖譜Demo的使用方式,并列舉了基于該事理圖譜能夠探索發現的幾個有趣例子。總結的來說,目前事理圖譜還十分復雜,無論是在精確度,還是在組織上都還存在著諸多不完善之處,如何基于該事件,進一步進行抽象建模,將事理圖譜進一步落地,將是我們接下來需要攻克的方向,愿同各位一道,在事理圖譜與知識工程上,砥礪前行!2019年的鐘聲即將敲響,在這次辭舊迎新之際,我們提前祝各位朋友在2019年中工作順利,身體健康,順著健康、穩定、繁榮的事理邏輯上穩扎穩打,更加輝煌!
總結
以上是生活随笔為你收集整理的我们的实践: 400万全行业动态事理图谱Demo的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android官方开发文档Trainin
- 下一篇: pytorch中的nan