“知识图谱+”系列:知识图谱+图神经网络
最近有很多朋友聯系澤宇說想了解一些知識圖譜和圖神經網絡(GNN)結合的研究。那澤宇當然要滿足朋友們的要求啊,本期澤宇從知識圖譜的幾個不同研究方向總結了結合GNN的經典研究,也和大家一起分享。所有內容是澤宇查閱了很多頂會論文,對每一類挑選出一篇具有代表性的論文進行解讀,如有理解有誤的地方還請批評指教。
本期是“知識圖譜+”系列的第一期“知識圖譜+圖神經網絡”,之后會陸續分享知識圖譜+各類方向的技術介紹,敬請關注。
為了方便大家一起交流討論知識圖譜技術,知識圖譜學術交流群已經成立了,感興趣想要入群的朋友們可以聯系澤宇拉大家入群。
預備知識:
圖神經網絡:個人認為,圖神經網絡最直觀的理解就是對于一個圖結構的輸入數據,由于每個節點和其鄰域中的節點都具有緊密的關聯,因此用圖神經網絡可以將每個節點的領域信息聚合起來更新當前節點的表示。但是知識圖譜和傳統的圖網絡結構最大的不同在于,知識圖譜是一個多關系圖數據結構,每對節點之間連接的邊的類型可能是不一樣的,因此,針對知識圖譜需要設計更特殊的圖神經網絡來建模知識圖譜。
知識圖譜嵌入:知識圖譜嵌入是將知識圖譜中的實體和關系轉換為數值化的表示,可以看成一個基礎任務,學習出的嵌入表示可以用于各種和知識圖譜相關的任務,本期介紹的和GNN結合的研究很多都需要用到知識圖譜嵌入技術,因此,希望入門了解知識圖譜嵌入的朋友可以看之前專門對知識圖譜嵌入的總結文章:
年末巨制:知識圖譜嵌入方法研究總結
1 知識圖譜表示學習
Modeling Relational Data with Graph Convolutional Networks. ESWC 2018.
Michael Schlichtkrull, Thomas N. Kipf(GCN的作者), Peter Bloem, Rianne van den Berg, Ivan Titov, Max Welling.
核心貢獻:這篇論文是圖卷積神經網絡(GCN)的發明者參與的一項研究,最大的貢獻在于開創性地將GCN用于建模知識圖譜這類多關系圖網絡,而以前的所有圖神經網絡的模型都只能建模只具有單一關系的圖網絡。
為了對多關系圖網絡進行建模,論文提出了多關系GCN,在學習每個實體的表示時,針對當前實體關聯的每個關系分別用GCN執行聚合操作,具體過程如下圖所示:
核心公式為:
由上式可以發現,每一層RGCN網絡針對每一個關系具有一組參數,這也是RGCN能夠建模多關系的關鍵所在,參數Wr類似于是關系的表示。
執行圖卷積操作只是為了學習實體的表示,要想實現更多功能還需要額外的模塊,本文給出了兩個具體的知識圖譜中的任務:實體分類和鏈接預測。
實體分類:
實體分類任務比較簡單,只需要用RGCN學習得到的實體表示接一個分類器模型就可以了,訓練的時候采用交叉熵loss函數。
鏈接預測:
鏈接預測任務需要利用RGCN學習出的實體表示,再結合知識圖譜表示學習的方法共同學習實體和關系的嵌入表示,并通過打分函數評估一個三元組成立的可能性,論文中采用的是DistMult模型,實際可以采用任何知識圖譜表示學習模型。整個鏈接預測的模型結構是一個encoder-decoder框架,RGCN是encoder,知識圖譜表示學習模塊是一個decoder。
2 實體對齊
Cross-lingual Knowledge Graph Alignment via Graph Convolutional Networks. EMNLP 2018.?
Authors: Zhichun Wang, Qingsong Lv, Xiaohan Lan, Yu Zhang.?
核心貢獻:這篇論文最大的特點是用基于GCN的知識圖譜嵌入模型學習了實體表示并用于跨語言的知識圖譜對齊(實體對齊)任務,取得不錯的實體對齊效果。并且,模型有效地結合了(實體,關系,實體)和(實體,屬性,屬性值)這兩類三元組,以改善實體對齊的效果。利用GCN 進行實體對齊的示意圖如下圖所示:
先用GCN學習到兩個知識圖譜中的實體嵌入表示,再根據實體嵌入表示計算兩個知識圖譜中實體的相似度,完成實體對齊。
本文之所以采用GCN是因為作者發現:
- 等價的實體具有更相似的屬性。
- 等價的實體具有的鄰域信息比較接近。
根據上面發現的兩個特點,為了同時利用實體的結構(領域)和屬性信息,本文方法為 GCN 網絡層中的每個實體分配了兩個特征向量,也就是結構特征向量和屬性特征向量。由于兩個知識圖譜中實體和屬性數量不同,所以需要采用兩個GCN來分別學習實體嵌入表示,這兩個GCN網絡的結構如下表所示:
從上表可以看到,兩個GCN在某些層共享權值矩陣,節省了模型參數,并且,對于屬性特征,通過GCN將兩個知識圖譜中的每個實體都映射到相同維度的空間中。整個模型采用TransE的Hinge Loss進行訓練。
3 小樣本知識圖譜補全
One-Shot Relational Learning for Knowledge Graphs. EMNLP2018.
Wenhan Xiong , Mo Yu , Shiyu Chang , Xiaoxiao Guo , William Yang Wang
這篇論文是第一次提出小樣本知識圖譜補全任務的研究,由于知識圖譜中存在大量小樣本的關系,這類關系只能夠關聯極少數的三元組,因此,論文結合GCN和度量學習實現了對于小樣本關系的尾實體預測。
核心貢獻:知識圖譜補全方向第一篇小樣本關系學習(本文特指one-shot,之后出現few-shot的研究)的工作。通過衡量參考三元組和查詢三元組中實體對的匹配程度,來判斷查詢三元組是否成立。小樣本知識圖譜補全簡而言之就是先讓你知道一個關系對應的幾個三元組(one-shot就只有一個三元組),然后問你(頭實體,關系,?)尾實體是什么。詳細的小樣本知識圖譜補全的任務介紹可以查閱論文。
小樣本學習的問題其實在圖像等領域已經有了很多研究,對于這類問題比較有效的方法是度量學習(Metric Learning)和基于優化的元學習(Meta Learning),這篇論文就是采用了度量學習的方案。
這篇論文最有意思的地方在于,考慮到一個關系對應的三元組數量很少,那就用關系對應的實體來表示這個關系,而這里實體假設不存在小樣本的問題,也就是實體具有很多的鄰域信息,那么,就可以借助實體的鄰域信息學習到好的實體表示,進而用來表示小樣本關系。基于這個思路,自然而然就想到了采用GCN來編碼實體的鄰域信息:
得到實體表示后,基于圖像中用到的深度匹配的方法,計算參考三元組中實體表示和查詢三元組中的實體表示的相似度,如果相似程度高說明查詢三元組成立,其中的尾實體為正確預測出的尾實體。
4 節點重要性估計
Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks. KDD 2019.
Authors: Namyong Park, Andrey Kan, Xin Luna Dong, Tong Zhao, Christos Faloutsos.
這篇論文研究的是估計知識圖譜中的節點重要性,可以應用于其它下游任務例如推薦系統等。
核心貢獻:這篇論文設計的GENI模型是一種基于GNN的方法,特點是GCN是用來聚合節點重要性得分,而不是像其它的用于知識圖譜的GCN那樣通過謂詞感知的注意力機制來聚合節點嵌入表示。
GNN通常通過節點嵌入在鄰居之間傳播信息,這是基于一個實體及其鄰居相互影響的假設進行建模,因此就其鄰居的表示而言,可以更好地表示一個實體的表示。但是,在節點重要性估計的任務中,相鄰重要性分數對節點的重要性起主要作用,而其他鄰居特征可能影響不大。整個模型的結構圖如下圖所示,其中紅框中為用GNN的打分聚合。GNN的輸入為scoring network生成的節點重要性打分,本文的scoring network實驗中采用的是簡單的多層全連接網絡。
5 關系預測
Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs. ACL 2019.
Authors: Deepak Nathani, Jatin Chauhan, Charu Sharma, Manohar Kaul.
這篇論文是研究知識圖譜中的關系預測任務,主要方法是在之前介紹的RGCN的基礎上,結合了attention機制設計的圖注意力網絡。
核心貢獻:針對知識圖譜的多關系圖數據結構,設計了融合實體和關系表示的圖注意力網絡(GAT),同時采用多頭注意力機制,在學習一個節點的表示時有效聚合了鄰域信息并考慮了不同鄰居對表示節點的重要程度,達到了良好的編碼知識圖譜的效果。本文設計的圖注意力機制的核心注意力模塊如下圖所示:
通過線性映射矩陣W1將頭實體hi,尾實體hj和關系gk的嵌入表示融合起來:
再經過非線性激活函數:
接著,就可以計算一個節點和其鄰域中每個節點之間的注意力權重:
再采用多頭注意力機制和GCN更新節點的嵌入表示:
6 關系抽取
Graph Convolution over Pruned Dependency Trees Improves Relation Extraction. EMNLP 2018.
Authors: Yuhao Zhang, Peng Qi, Christopher D. Manning.
這篇論文是利用GCN實現關系抽取的高被引經典研究,提出了針對關系抽取量身定制的一種新型圖卷積網絡。模型使用有效的圖卷積運算對輸入句子的依存關系結構進行編碼,然后抽取以實體為中心的表示,以進行可靠的關系預測。
核心貢獻:利用 GCN 編碼依存結構的句子并實現關系抽取,并設計了一個以路徑為中心的剪枝策略移除依存樹中與關系抽取無關的路徑。
還是一樣,我們主要看看這篇論文中是如何利用GCN的。這里特別的是,GCN不是編碼某個已經建立好的圖數據,而是需要對整個句子進行編碼,更準確的說,GCN應該是對句子的依存結構進行編碼
這里特殊之在于,Aij表示當前第i個詞是否與第j個詞存在依存關系,如果存在值是1,類似于圖結構中的鄰接矩陣。
為了解決GCN無法建模長距離依賴關系的問題,在改進方法中,論文提出了基于上下文的GCN模型,在前面介紹的GCN網絡前接一個Bi-LSTM,將編碼了上下文信息的詞表示輸入GCN中,大大提高了整個模型的效果。
之后,將GCN輸出的句子表示和頭尾實體表示拼接輸入分類器中,完成關系抽取任務。
7 知識圖譜推薦
KGAT: Knowledge Graph Attention Network for Recommendation. KDD 2019.
Authors: Xiang Wang, Xiangnan He, Yixin Cao, Meng Liu, Tat-Seng Chua.
這篇論文是非常經典的結合圖注意力網絡來實現知識圖譜推薦的研究,為了實現推薦,作者將用戶、項目和實體融合起來構建了一個協同知識圖譜,并在這個協作知識圖譜上使用知識圖譜注意力網絡學習節點表示。
核心貢獻:建模協同知識圖譜中顯式的高階關系可以通過項目側信息提供更好的推薦。論文中提出的KGAT方法在圖神經網絡框架下以顯式且端到端的方式實現了高階關系建模。整個模型結構如下圖所示:
實體和關系的嵌入表示首先通過知識圖譜嵌入模型TransR訓練得到:
接著,利用TransR的投影機制將實體表示投影到關系空間中,并通過內積的形式計算一個三元組的打分:
有了上式的三元組打分就可以計算注意力權重了:
進一步,利用圖注意力機制和實體的鄰域信息學習每個實體的鄰域表示:
基于上面得到的實體鄰域表示,就可以按照GCN的套路更新實體表示了:
接著,按照推薦系統的任務要求,用上面介紹的圖注意力網絡在整個協同知識圖譜中學習用戶和項目的表示,并計算內積得到用戶和項目的匹配程度:
8 事件抽取
Jointly Multiple Events Extraction via Attention-based Graph Information Aggregation. EMNLP 2018.
Authors: Xiao Liu, Zhunchen Luo, Heyan Huang.
這篇論文是利用GCN做多事件抽取的研究,提出了一種新穎的聯合多個事件抽取(JMEE)框架,通過引入句法捷徑弧和圖卷積網絡加自注意力機制來建模圖結構信息。
核心貢獻:論文提出了一種基于句法結構的新型聯合事件抽取框架JMEE,核心模塊是利用自注意力機制來聚集圖結構信息,保持了多個事件之間的關聯,并有效地應用在事件抽取中。
本文的事件抽取模型需要對一句話中的所有token經過詞嵌入層和Bi-LSTM層,之后將得到的無向圖轉換為帶有自環的有向圖結構,并利用GCN計算每個節點的表示:
其中,GCN的第一層網絡輸入也就是每個節點的初始表示是在GCN之前計算得到的詞向量表示。
接著,將用GCN學習到的每個token的表示輸入帶有自注意力機制的事件觸發分類器和事件參數分類器中完成事件抽取任務。
9 知識圖譜概率邏輯推理
Efficient Probabilistic Logic Reasoning with Graph Neural Networks. ICLR 2020.
Authors: Yuyu Zhang, Xinshi Chen, Yuan Yang, Arun Ramamurthy, Bo Li, Yuan Qi, Le Song.
馬爾可夫邏輯網由于融合了邏輯規則和概率圖模型,能夠實現知識圖譜上的概率邏輯推理,本文借助GNN提高了概率推理的效率和性能。
核心貢獻:本文設計的模型中最核心的模塊就是ExpressGNN,ExpressGNN可以看成是對實體的兩級編碼:緊湊的GNN將相似的嵌入分配給知識圖譜中的相似實體,而可表達的可調嵌入提供了額外的模型能力,可以對圖結構以外的實體特定信息進行編碼。ExpressGNN的偽碼如下所示:
論文中介紹了ExpressGNN具有的一些優良特性:
- 高效:ExpressGNN直接作用在知識圖譜上,而不是在龐大的馬爾可夫邏輯網上工作,使其比現有的MLN推理方法更有效。
- 緊湊性:具有共享參數的緊湊型GNN模型可以非常有效地提高內存效率,從而使ExpressGNN可以處理大規模的問題。
- 豐富的表現力:GNN模塊可以捕捉知識圖譜中編碼的結構知識。同時,可調嵌入模塊可以對特定于實體的信息進行編碼,從而彌補了GNN在區分非同構節點方面的不足。
- 泛化性:通過GNN嵌入,ExpressGNN可以對新實體通用,也就是對于零樣本的問題也可以很好的解決。
10 借助知識圖譜的動作識別
I Know the Relationships: Zero-Shot Action Recognition via Two-Stream Graph Convolutional Networks and Knowledge Graphs. AAAI 2019.
Author: Junyu Gao, Tianzhu Zhang, Changsheng Xu.
這篇論文主要研究的是零樣本動作識別任務,作者發現除了視覺特征外,外部知識用來建模對象之間的顯式關系也同樣重要。
核心貢獻:提出了一種新穎的兩分支的 GCN 框架,該框架可以有效地利用知識圖譜來對動作-屬性,動作-行為和屬性-屬性之間的關系進行建模。為了從動作和屬性中分別實現知識蒸餾,利用GCN設計了分類器分支和實例分支,以端到端的方式實現動作分類。整個模型的結構圖如下圖所示:
分類器分支:旨在為不同的動作類別生成分類器,該分類器將一組概念及其對應的詞嵌入向量作為輸入。
實例分支:旨在利用從視頻取得的打分來生成視頻實例的屬性特征。
本文采用GCN最大的優勢在于,兩個分支通過用GCN編碼知識圖譜共同對知識空間中的行為-屬性,行為-行為和屬性屬性之間的關系進行建模。學習的分類器(分類器分支)可以以端到端的方式有效地評估每個視頻的生成的屬性特征(實例分支)。
好了,以上就是本期所有對于知識圖譜+圖神經網絡的學習分享了。所有內容都是澤宇經過調研和學習理解總結的,之后還會陸續分享知識圖譜+各類方向的技術介紹,如果大家有對某個方向感興趣的可以聯系澤宇,敬請關注啊。
往期精選:
知識圖譜和專家系統、知識工程、數據庫等概念的比較
年末巨制:知識圖譜嵌入方法研究總結
介紹一些知識圖譜的實際應用類項目
知識圖譜最新權威綜述論文解讀:知識表示學習部分
手把手教你搭建一個中式菜譜知識圖譜可視化系統
如果對文章感興趣歡迎關注知乎專欄“人工智能遇上知識圖譜“,也可以掃描下方二維碼關注同名微信公眾號“人工智能遇上知識圖譜”,讓我們一起學習并交流討論人工智能與知識圖譜技術。
?
總結
以上是生活随笔為你收集整理的“知识图谱+”系列:知识图谱+图神经网络的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 1 计算机组成原理第一章 计算机系统概述
- 下一篇: 基于深度强化学习的区域化视觉导航方法