论文浅尝 | Tree-to-sequence 学习知识问答
論文筆記整理:譚亦鳴,東南大學博士生,研究興趣:知識圖譜問答。
?
來源:Neurocomputing 372: 64-72 (2020)
鏈接:https://sciencedirect.xilesou.top/science/article/abs/pii/S0925231219312639
?
對于知識圖譜問答來說,主要任務(wù)是將自然語言問題映射到具有相同意義的結(jié)構(gòu)化query上。但是目前基于深度學習的方法都僅關(guān)注了問題和關(guān)系鏈之間的語義對應,而忽視了query的結(jié)構(gòu)信息。這篇文章提出將query視作tree,從而將實體和關(guān)系的順序信息也編碼進它們的向量表示中,從而更好的劃分給定問題的candidate query。
動機
目前的深度學習方法主要利用關(guān)系鏈匹配而非整個query匹配給定的問題,這種做法并不能有效利用query結(jié)構(gòu)信息。
因此作者提出將candidate query的結(jié)構(gòu)編碼進它的向量表示中,從而強化它與給定問題的匹配準確性。
方法
? ? ? ? ? ? ?
?
圖3是作者提出方法的整體框架,以問題“what character did natalie portman play in star wars ?”為例,整體的框架流程描述如下:
1. 約束鏈接 作者提出了三種約束將問題中的成分關(guān)聯(lián)到知識圖譜上:(i)實體,使用目前性能最好的S-MART實體鏈接工具完成鏈接。(ii)類型,在知識圖譜中查詢所有類型的type,當問題中出現(xiàn)了某種類型的查詢詞時,完成類型鏈接。(iii)數(shù)字,分為以下三種情況,單獨的數(shù)字,比較性詞匯+數(shù)字的組合,最值表示(最大最小最年輕等等),將對應類型的邏輯操作添加到query中。;
2. Candidate Query構(gòu)建 本質(zhì)上是給出幾種可能對應問題的帶有缺省值的子圖,首先根據(jù)實體鏈接確定子圖中的實體節(jié)點(圖中的葉子節(jié)點),然后使用中間節(jié)點將它們連起來,并選擇任一中間節(jié)點作為答案節(jié)點,(需要時)補充上類型約束以及數(shù)字操作之后得到Candidate Query。(有點像排列組合,作者在論文中對每個步驟做了詳細說明,有需要的童鞋可以讀讀原文3.2節(jié))
3. Tree-based Encoder 圖4描述了本文提出的基于樹的編碼過程,在這個圖中,與這兩個實體-關(guān)系pair共同組成?x的描述,在這個方向中,所有的實體類型數(shù)字操作和關(guān)系等等信息都流向answer節(jié)點(作者稱其為前向,反之則為后向),在這種形式下,詞與詞之間根據(jù)位置信息的不同,可以互相定義為:preceding,sibling以及following。這些結(jié)構(gòu)信息使得那些節(jié)點相同(相似)的Candidate query由于位置信息的差異被區(qū)分開來。為了將這種結(jié)構(gòu)加入到表示學習中,作者使用一個tree-based LSTM進行編碼(對相關(guān)公式證明感興趣的請見原文3.3節(jié))。
? ? ? ? ? ? ?
4. Mixed-mode Decoder 在解碼過程的目的是選出最為匹配question的candidate query,這里作者引入了兩個解碼模式,用以處理兩種類型的query-question匹配:其一是generating mode,由一個使用QA pair訓練的LSTM網(wǎng)絡(luò)構(gòu)成。其二是referring mode,一個利用在網(wǎng)頁對KB的遠程監(jiān)督學習到的統(tǒng)計模型,用以處理QA pair不足時,引入原始Web-KB對齊用以強化query與question之間的對應。
? ? ? ? ? ? ?
實驗
實驗使用的問答數(shù)據(jù)集是WebQuestion(3778個問題用于訓練,2032訓練)以及WebQuestionSP(移去了WebQuestion中那些無法使用query表示的問題,3098訓練,1639用于測試),問題包含單三元組的簡單問題以及包含四個關(guān)系的問題還有聚合類型的問題。
評價指標為準確率,召回率以及F1:
? ? ? ? ? ? ?
與現(xiàn)有方法的實驗結(jié)果橫向?qū)Ρ热绫?:
? ? ? ? ? ? ?
從性能上看并非最好的,但作者表示他們的主要貢獻在于利用并證明了query結(jié)構(gòu)信息在QA任務(wù)上的有效性。
?
?
OpenKG
開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數(shù)據(jù)的開放與互聯(lián),促進知識圖譜和語義技術(shù)的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結(jié)
以上是生活随笔為你收集整理的论文浅尝 | Tree-to-sequence 学习知识问答的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 开源开放 | 移动应用知识图谱MAKG(
- 下一篇: 论文浅尝 | 采用成对编码的图卷积网络用