论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法
作者:張文,浙江大學(xué)在讀博士,研究方向?yàn)橹R(shí)圖譜的表示學(xué)習(xí),推理和可解釋。
本文是我們與蘇黎世大學(xué)以及阿里巴巴合作的工作,發(fā)表于WWW2019,這篇工作將知識(shí)圖譜推理的兩種典型方法,即表示學(xué)習(xí)和規(guī)則進(jìn)行了結(jié)合,提出了IterE,并實(shí)現(xiàn)了兩者的優(yōu)勢(shì)互補(bǔ)。
推理可以幫助知識(shí)圖譜補(bǔ)全以及知識(shí)圖譜的沖突檢測(cè),能夠有效幫助提升知識(shí)圖譜的質(zhì)量。目前知識(shí)圖譜推理的典型方法有兩種,一種是表示學(xué)習(xí)方法,將知識(shí)圖譜中的元素映射到連續(xù)的向量空間并通過(guò)向量空間中的計(jì)算完成推理,一種是規(guī)則挖掘方法,挖掘知識(shí)圖譜中存在的邏輯規(guī)則,然后利用規(guī)則進(jìn)行推理。表示學(xué)習(xí)方法通過(guò)模型計(jì)算自動(dòng)完成推理,在大規(guī)則知識(shí)圖譜上有較好的優(yōu)勢(shì),規(guī)則由于其符號(hào)表示特性對(duì)人較友好和推理結(jié)果的可解釋性較強(qiáng),但兩者都存在各自的缺點(diǎn),其中表示學(xué)習(xí)方法對(duì)稀疏的實(shí)體無(wú)法學(xué)到較好的向量表示因而預(yù)測(cè)結(jié)果較差,而傳統(tǒng)基于圖遍歷搜索的規(guī)則挖掘方法在大規(guī)模知識(shí)圖譜上會(huì)遇到明顯的效率問(wèn)題。本文提出了一個(gè)方法將表示學(xué)習(xí)和規(guī)則挖掘結(jié)合在一起,互相彌補(bǔ)各自的瓶頸。
本文結(jié)合表示學(xué)習(xí)和規(guī)則挖掘的思路建立于我們發(fā)現(xiàn)了基于線性變換假設(shè)的表示學(xué)習(xí)模型對(duì)于規(guī)則挖掘具有很好的友好性,線性變換假設(shè)即將一個(gè)知識(shí)圖譜中的三元組(h,r,t)中的頭尾實(shí)體h和t表示為向量h和t并將關(guān)系r表示為矩陣Mr,且假設(shè)對(duì)于正確的三元組滿足 hMr=t。本文的規(guī)則類型參考了OWL2中的定義,選擇了7種類型的規(guī)則,對(duì)于這7種規(guī)則,從線性變換假設(shè)中我們都可以得出一個(gè)特殊的結(jié)論如下表所示:
上表中的rule conclusion是本文從表示學(xué)習(xí)結(jié)果中學(xué)習(xí)規(guī)則的重要依據(jù)。
?
下面介紹本文的核心想法,如下圖所示:
主要包含三個(gè)模塊,Embedding Learning模塊,Axiom Induction模塊,以及Axiom Injection模塊,下面分別簡(jiǎn)單介紹一個(gè)這三個(gè)模塊的核心功能:
Embedding Learning模塊:通過(guò)知識(shí)圖譜中存在的三元組以及規(guī)則推理出的三元組進(jìn)行知識(shí)圖譜的表示學(xué)習(xí),本文采用的是基于線性變換假設(shè)的表示學(xué)習(xí)模型ANALOGY。
Axiom Induction模塊:通過(guò)Embedding Learning模塊學(xué)到的表示結(jié)果參考上文介紹的7種規(guī)則所對(duì)應(yīng)的結(jié)論計(jì)算出置信度較高的規(guī)則。為了提高規(guī)則計(jì)算的效率,本文還設(shè)計(jì)了一個(gè)潛在規(guī)則集合的生成策略來(lái)有效地生成候選規(guī)則池。
Axiom Injection模塊:根據(jù)Axiom Induction模塊生成的規(guī)則集合為稀疏的實(shí)體推理出新的三元組并添加到知識(shí)圖譜中以減小其對(duì)應(yīng)的實(shí)體稀疏度,并為每一個(gè)新生成的三元組標(biāo)上合適的真值標(biāo)簽。最后將添加了新的三元組的知識(shí)圖譜再次送到Embedding Learning模塊中以更新表示學(xué)習(xí)的結(jié)果。
從上面的介紹中可以看出,本文提出的方法是一個(gè)迭代進(jìn)行表示學(xué)習(xí)和規(guī)則挖掘并進(jìn)行互相增強(qiáng)的過(guò)程,所以我們將本文提出的方法命名為IterE。
我們?cè)?/span>4個(gè)數(shù)據(jù)集上對(duì)IterE的進(jìn)行了實(shí)驗(yàn),并主要驗(yàn)證了以下三件事情:
通過(guò)鏈接預(yù)測(cè)的實(shí)驗(yàn)我們證明了規(guī)則確實(shí)幫助提升了稀疏實(shí)體預(yù)測(cè)結(jié)果,實(shí)驗(yàn)結(jié)果如下:
通過(guò)表示學(xué)習(xí)確實(shí)提升了規(guī)則挖掘的效率,規(guī)則挖掘的效率和質(zhì)量結(jié)果如下所示:
在逐步迭代的過(guò)程中,表示學(xué)習(xí)結(jié)果和規(guī)則挖掘結(jié)果都實(shí)現(xiàn)了逐步增強(qiáng),證明了迭代策略的有效性,結(jié)果如下:
OpenKG
開放知識(shí)圖譜(簡(jiǎn)稱 OpenKG)旨在促進(jìn)中文知識(shí)圖譜數(shù)據(jù)的開放與互聯(lián),促進(jìn)知識(shí)圖譜和語(yǔ)義技術(shù)的普及和廣泛應(yīng)用。
點(diǎn)擊閱讀原文,進(jìn)入 OpenKG 博客。
總結(jié)
以上是生活随笔為你收集整理的论文浅尝 | 知识图谱推理中表示学习和规则挖掘的迭代学习方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: mikechen详谈架构师成长之3大步骤
- 下一篇: 论文浅尝 – KDD2020 | 使用图