速览EMNLP 2020上录取的知识图谱相关论文
文 | 澤宇
源 | 知乎
前不久,自然語言處理領域三大頂會之一的 EMNLP 2020 發布了論文錄取的結果。在EMNLP 2020論文正式出版之前,澤宇搜集了目前Arxiv上已經發布出來的錄取在EMNLP 2020上所有和知識圖譜相關的論文,下面我們就一起來一睹為快。
1. 知識圖譜嵌入(表示學習)
AutoETER: Automated Entity Type Representation for?Knowledge?Graph?Embedding
Authors:?Guanglin Niu,?Bo Li,?Yongfei Zhang,?Shiliang Pu,?Jingyang Li
論文地址:
https://arxiv.org/pdf/2009.12030
內容簡介: 知識圖譜表示學習領域的研究,一作是北航的Guanglin Niu。本文將知識圖譜中實體-關系-實體的三元組擴展到實體類型-關系-實體類型的類型相關的三元組,提出能夠自動化學習實體類型的向量表示的AutoETER模型,并給出建模和推理對稱、逆反、傳遞關系的理論證明,同時能夠解決1-N,N-1和N-N這類復雜關系的推理問題。特別的,論文中提出的AutoETER是一個可適配于任意知識圖譜表示學習模型的可插播模塊,用于提供實體類型表示并進一步提升原有知識圖譜表示學習模型的性能。在四個不同數據集上的實驗結果表明本文提出的AutoETER方法的有效性和先進性。實驗中還給出了可視化分析,可以直觀看出實體類型表示的聚類效果明顯優于實體表示的聚類效果,說明了實體類型表示的有效性。
Knowledge?Association with Hyperbolic?Knowledge?Graph?Embeddings
Authors:?Zequn Sun,?Muhao Chen,?Wei Hu,?Chengming Wang,?Jian Dai,?Wei Zhang
論文地址:
https://arxiv.org/pdf/2010.02162
內容簡介: 這篇論文同樣是知識圖譜表示學習領域的研究,一作是南京大學的Zequn Sun。傳統的知識圖譜表示學習模型依賴于較高的嵌入尺寸來實現足夠的表現力。與此不同,這篇論文使用低維雙曲嵌入來探索知識關聯。通過提出用于知識圖譜嵌入的雙曲關系圖神經網絡,并利用雙曲變換取得知識關聯。關于實體對齊和實體類型推理的大量實驗證明了本文方法的有效性。
Evaluating the Calibration of?Knowledge?Graph?Embeddings for Trustworthy Link Prediction
Authors: Tara Safavi,?Danai Koutra,?Edgar Meij
論文地址:
https://arxiv.org/pdf/2004.01168
內容簡介: 當前,很少去評估知識圖譜表示學習模型所做預測的可信賴性。本文首先根據標準的封閉世界假設進行評估,在該假設中,知識圖譜中尚未出現的預測三元組被認為是錯誤的,并表明在這種(通用但狹窄的)假設下,現有的校準技術對知識圖譜表示學習有效。接下來,在更現實但更具挑戰性的開放世界假設中,只有取得實實在在的標簽,才能將未觀察到的預測視為真或假。論文中表明,在開放世界假設下,現有的校準技術遠不如在封閉世界假設中有效,并提供了這種差異的解釋。本文進行了人與AI協作的獨特案例研究,顯示了經過校準的預測可以提高知識圖譜補全任務的效果。
2. 結合知識圖譜的對話、問答和文本生成
GraphDialog: Integrating?Graph?Knowledge?into End-to-End Task-Oriented Dialogue Systems
Authors: Shiquan Yang,?Rui Zhang,?Sarah Erfani
論文地址:
https://arxiv.org/pdf/2010.01447
內容簡介: 本文利用知識圖譜中以及對話的依存關系分析樹中的圖結構信息來提高端到端面向任務的對話系統的性能。為了有效地利用對話歷史中的結構信息,本文提出了一種新的循環單元結構,該結構允許在圖上進行表示學習。為了利用知識圖譜中的實體之間的關系,該模型結合了基于圖結構的多跳推理能力。實驗結果表明,在兩個不同的面向任務的對話數據集上,所提出的模型取得了優于最新模型的一致改進。
Scalable Multi-Hop Relational Reasoning for?Knowledge-Aware Question Answering
Authors:Yanlin Feng,?Xinyue Chen,?Bill Yuchen Lin,?Peifeng Wang,?Jun Yan,?Xiang Ren
論文地址:
https://arxiv.org/pdf/2005.00646
內容簡介: 知識庫問答領域的研究,一作是北大的Yanlin Feng。現有的利用知識圖譜增強問答模型的工作要么難以有效地建立多跳關系,要么在模型的預測原理上缺乏透明度。本文提出了一種新穎的知識感知方法,該方法為預訓練語言模型(PTLM)配備了多跳關系推理模塊,稱為多跳圖關系網絡(MHGRN)。它對從知識圖譜提取的子圖執行多跳,多關系推理。所提出的推理模塊統一了基于路徑的推理方法和圖神經網絡的方法,以實現更好的可解釋性和可擴展性。
Language Generation with Multi-Hop Reasoning on Commonsense?Knowledge?Graph
Authors: Haozhe Ji,?Pei Ke,?Shaohan Huang,?Furu Wei,?Xiaoyan Zhu,?Minlie Huang
論文地址:
https://arxiv.org/pdf/2009.11692
內容簡介: 結合常識知識的文本生成領域的研究,一作是清華的Haozhe Ji。利用知識圖譜的結構和語義信息可促進常識性文本生成。在本文中,作者提出了使用多跳推理流程(GRF)進行生成的方法,該方法可以在從外部常識知識圖譜中提取的多關系路徑上啟用帶有動態多跳推理的預訓練模型。實驗結果表明在需要推理常識性知識的三個文本生成任務上,本文提出的模型優于現有基準模型。同時,通過模型推斷出的推理路徑為文本生成提供了可解釋性。
3. 知識圖譜嵌入相關的負采樣、超關系和數據集
Structure Aware Negative Sampling in?Knowledge?Graphs
Authors: Kian Ahrabian,?Aarash Feizi,?Yasmin Salehi,?William L. Hamilton,?Avishek Joey Bose
論文地址:
https://arxiv.org/pdf/2009.11355
內容簡介: 知識圖譜嵌入模型普遍是使用對比估計來學習知識圖譜中的實體和關系的低維表示。由于知識圖譜中只存在正樣本,因此對比學習方法的一個關鍵是選擇產生負樣本的分布,這將迫使嵌入模型學習判別式表示并找到觀測數據的關鍵特征。本文提出了一種結構感知的負采樣(SANS),這是一種廉價的負采樣策略,不需要其他參數,也不需要困難的對抗性優化,而是通過從節點的k跳鄰域中選擇負采樣來利用豐富的圖結構。實驗證明SANS可以找到與SOTA方法具有高度競爭力的高質量負樣本。
Message Passing for Hyper-Relational?Knowledge?Graphs
Authors: Mikhail Galkin,?Priyansh Trivedi,?Gaurav Maheshwari,?Ricardo Usbeck,?Jens Lehmann
論文地址:
https://arxiv.org/pdf/2009.10847
內容簡介: 超關系知識圖譜(例如Wikidata)可將其他鍵值對與主要三元組關聯起來以消除歧義或對一個事實在不同情況下的有效性進行約束。在這項工作中,我們提出了一種基于消息傳遞的圖編碼器-StarE,它能夠對這種超關系知識圖譜進行建模。與現有方法不同,StarE可以編碼任意數量的附加信息以及主要三元組,同時保留限定符和三元組的語義不變。論文中證明現有的用于評估超關系知識圖譜補全性能的benchmark存在缺陷,因此構建了基于Wikidata的新數據集WD50K。實驗表明StarE在多個基準測試中均優于現有方法。
CoDEx: A Comprehensive?Knowledge?Graph?Completion Benchmark
Authors: Tara Safavi,?Danai Koutra
論文地址:
https://arxiv.org/pdf/2009.07810
內容簡介: 本文構建了一個新的用于知識圖譜補全的benchmark數據集CoDEx,其是從Wikidata和Wikipedia中提取的,可以更為全面有效的評價知識圖譜補全的性能。CoDEx包括三個大小和結構各異的知識圖譜,實體和關系的多語言描述。論文中給出了在CoDEx上五個經過廣泛使用的知識圖譜嵌入模型的鏈接預測和三元組分類的結果。
數據,代碼和預訓練模型的github地址:
https://github.com/tsafavi/codex。
4. 知識圖譜中的事件抽取
Biomedical Event Extraction on?Graph?Edge-conditioned Attention Networks with Hierarchical?Knowledge?Graphs
Authors: Kung-Hsiang Huang,?Mu Yang,?Nanyun Peng
論文地址:
https://arxiv.org/pdf/2009.09335
內容簡介: 本文屬于知識圖譜構建中的事件抽取領域。生物醫學事件抽取對于理解科學語料庫中描述的生物分子相互作用至關重要。本文通過Graph Edge-conditioned的注意力網絡(GEANet)和分層圖表示,將來自統一醫學語言系統(UMLS)的領域知識合并到預先訓練的語言模型中。為了更好地識別觸發詞,首先基于來自UMLS的聯合建模的層次知識圖譜,將每個句子ground to句子圖譜上。然后,grounded graph由GEANet傳播,GEANet是一種新穎的圖神經網絡,用于增強推斷復雜事件的能力。在BioNLP 2011 GENIA事件抽取任務上,本文提出的方法顯示出顯著的性能提升。
Edge-Enhanced?Graph?Convolution Networks for Event Detection with Syntactic Relation
Authors: Shiyao Cui,?Bowen Yu,?Tingwen Liu,?Zhenyu Zhang,?Xuebin Wang,?Jinqiao Shi
論文地址:
https://arxiv.org/pdf/2002.10757
內容簡介: 本文同樣屬于事件抽取領域,一作是來自中科院信工所的Shiyao Cui。事件檢測是信息抽取的關鍵子任務,旨在識別文本中特定事件類型的實例。本文提出了一種名為邊增強的圖卷積網絡(EE-GCN),該網絡同時利用句法結構和類型標簽信息來執行事件檢測。特別的,本文中設計的邊感知節點更新模塊和節點感知邊更新模塊相互補充,并且以相互促進的方式工作。通過對廣泛使用的ACE2005數據集進行了實驗,結果表明,與競爭性基準方法相比,本文方法有明顯改進。
5. 知識圖譜推理
Learning Collaborative Agents with Rule Guidance for?Knowledge?Graph?Reasoning
Authors: Deren Lei,?Gangrong Jiang,?Xiaotao Gu,?Kexuan Sun,?Yuning Mao,?Xiang Ren
論文地址:
https://arxiv.org/pdf/2005.00571
內容簡介: 本文屬于知識圖譜多跳推理領域,一作是來自南加州的Deren Lei。基于強化學習的知識圖譜推理具有可解釋性的優勢。但是,遍歷知識圖譜提供的稀疏獎勵信號通常不足以指導復雜的強化學習模型。一種替代方法是使用傳統的符號方法,其實現了良好的性能,但是由于符號表示的限制而可能難以概括。本文提出了一種結合規則的知識圖譜多跳推理模型RuleGuider,其利用基于符號的方法生成的高質量規則為基于游走的代理提供獎勵監督。在基準數據集上進行的實驗表明,RuleGuider在不損失可解釋性的情況下提高了基于游走的模型的性能。
后臺回復關鍵詞【入群】
加入賣萌屋NLP/IR/Rec與求職討論群
后臺回復關鍵詞【頂會】
獲取ACL、CIKM等各大頂會論文集!
總結
以上是生活随笔為你收集整理的速览EMNLP 2020上录取的知识图谱相关论文的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 百度提出新冠高风险小区预警算法,AAAI
- 下一篇: 你已经是一个成熟的地图了,该学会帮我..