白雪 | NLP加持知识图谱在金融事件挖掘中的应用
本文轉(zhuǎn)載自公眾號:阡尋科技。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
9月15日訊,涵蓋金融科技、人工智能及區(qū)塊鏈領(lǐng)域的2018恒生技術(shù)開放日于今日開幕,阡尋科技聯(lián)席CEO、復(fù)旦大學(xué)人工智能方向博士白雪受邀出席本次大會,分享了金融領(lǐng)域事件特點分析、常用的事件抽取方法以及金融知識圖譜加持NLP等方面的實踐與心得。與參會人員共同探討了自然語言與知識圖譜未來的發(fā)展方向,并對人工智能技術(shù)在金融領(lǐng)域的應(yīng)用進行了展望。
資本運作,并購、高管動向等事件會對金融產(chǎn)品價格產(chǎn)生沖擊,這些事件會引發(fā)股票、期貨等金融產(chǎn)品價格的波動,并且由于各方對事件解讀的觀點不同,對標(biāo)的價格也會產(chǎn)生不同的影響,故需要對這些事件進行特點分析,通過文本數(shù)據(jù)解析與語義理解,從多維度建立立體的關(guān)聯(lián)關(guān)系,來滿足投資者對事件更快、更全、更準(zhǔn)確的挖掘需求。
?
事件抽取是對文本進行預(yù)處理、觸發(fā)詞抽取與論元識別等步驟后,從非結(jié)構(gòu)化信息中抽取出特定的元素,并以結(jié)構(gòu)化的形式呈現(xiàn)給用戶。白博士向大家展示了事件抽取的大致流程,首先以基于規(guī)則或機器學(xué)習(xí)的方法來判斷句子的屬性,然后抽取事件骨干,同時圍繞同一事件可能存在的多個表達句子,用實體對齊、同義詞對齊等手段進行泛化,再通過抽取公共子串或“填坑”的方式來“拼湊”完整的事件表達式。
?
金融行業(yè)產(chǎn)業(yè)鏈上的各元素之間存在著一定的邏輯關(guān)系,這些相近的元素可以從詞庫的擴充,子圖近鄰的相似等方面,進行語義理解與詞法分析處理,對NLP進行加持與助力,進一步的,還能基于圖譜路徑進行事件的關(guān)聯(lián)和推理。知識圖譜在場景識別、關(guān)聯(lián)查詢、交叉驗證等各種NLP和AI任務(wù)上都能起到積極作用。
在事件沿知識圖譜的推理上,白博士以泰國特大洪水與新能源汽車銷量上漲,分別對橡膠行業(yè)和下游碳酸鋰電池生產(chǎn)企業(yè)股價的影響為例,分析了沿知識圖譜多步推理的原理,此項技術(shù)在金融投資領(lǐng)域具有廣泛的需求,可幫助人們及時發(fā)現(xiàn)投資機會與潛在風(fēng)險。
白博士坦言NLP+知識圖譜、事件抽取和推理等方向,尚處在研發(fā)應(yīng)用初級階段,未來發(fā)展空間很廣,仍需大家不斷的努力。
阡尋科技將深度發(fā)掘自然語言與知識圖譜在金融科技、工業(yè)智能化、監(jiān)管科技領(lǐng)域的應(yīng)用,為市場帶來股票對話機器人、事件預(yù)警、智能資訊、自動報告、智能公告、知識圖譜構(gòu)建與推理、智能礦山系統(tǒng)等多種產(chǎn)品,打造一個全方位覆蓋行業(yè)產(chǎn)業(yè)鏈的數(shù)字信息平臺。
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數(shù)據(jù)的開放與互聯(lián),促進知識圖譜和語義技術(shù)的普及和廣泛應(yīng)用。
點擊閱讀原文,進入 OpenKG 博客。
總結(jié)
以上是生活随笔為你收集整理的白雪 | NLP加持知识图谱在金融事件挖掘中的应用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谷歌、微软、OpenAI等巨头七大机器学
- 下一篇: 揭秘任务型对话机器人(下篇)