论文浅尝 | Complex Embeddings for Simple Link Prediction
The ?o Trouillon, Johannes Welb, Sebastian Riedel, E?ricGaussier, Guillaume Bouchard . Complex Embeddings for Simple Link Prediction. In Proceedings of the 33ndInternational Conference on Machine Learning, pages 2071– 2080 (ICML2016)
論文鏈接:http://proceedings.mlr.press/v48/trouillon16.pdf
在統計關系學習里,鏈接預測問題是自動理解大規模知識庫結構的核心。為了更好得把握知識庫二元關系中的對稱和非對稱關系,本文提出了基于復數的表示方法 ComplEx。
一些研究工作將鏈接預測看作是三維二元張量補全的問題,張量的每一個slice表示知識庫中關于一種關系的臨接矩陣。典型的做法是對表示知識庫的張量進行低秩分解,用分解得到的矩陣的每一行表示知識庫中的一個實體或者一種關系。最后對于一個給定的三元組 r(s,o)(注:即主語 s 和賓語 o 具有關系 r),這個三元組的 score 可以通過對于 s,r,o 的表示向量之間的多線性(multi-linear)乘積計算得到。以往工作的問題在于不能很好地處理非對稱關系,因為實數向量之間的點積計算是具有交換性的,即如果實數表示下的 r(s,o) 成立,那么 r(o,s) 也必然成立,但在知識庫中非對稱關系的比例遠多于對稱關系的比例。所以本文提出了一個基于復數表示的方法,因為復數之間的埃爾米特乘積(Hermitian dot product)是不具有交換性的,具體做法如下:
每個實體和關系都用一個復數向量表示,每個三元組的 score function 定義如下:
Re(x) 表示取 x 的實部,Im(x) 表示取 x 的虛部,三元組 (s,r,o) 的 score 計算過程為關系 r 的表示向量和主語 s 的表示向量以及賓語 o 的表示向量的共軛向量的乘積,并保留最后結果的實部。最終 (s,r,o) 為真的概率通過下式得到:
以下是 ComplEx 在對稱關系和非對稱關系的實驗結果:
從左上的圖中可以看出,Complex 和 DistMult 都可以較好地捕捉對稱關系的語義信息并做出正確的預測,從右上的圖中可以看出 Complex 對于非對稱關系語義的捕捉以及預測效果明顯優于其他模型。也驗證了模型用復數表示的設計思想。
下圖是在 WN18 和 FB15 上的鏈接預測的實驗結果:
模型簡潔的 ComplEx 在兩個數據集上都取得了不錯的效果,明顯好于當時表現優異的 HolE。
本文模型設計背后的數學思想是比較值得借鑒的地方。
本文作者張文,浙江大學博士在讀,研究興趣為知識圖譜,表示學習,常識推理和自然語言處理。
OpenKG.CN
中文開放知識圖譜(簡稱OpenKG.CN)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
轉載須知:轉載需注明來源“OpenKG.CN”、作者及原文鏈接。如需修改標題,請注明原標題。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的论文浅尝 | Complex Embeddings for Simple Link Prediction的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 商汤科技-数据运维工程师-提前批笔试题目
- 下一篇: 知识图谱入门 (八) 语义搜索