论文浅尝 | 虚拟知识图谱:软件系统和应用案例综述
本文轉載自公眾號:DI數據智能。
Virtual Knowledge Graphs: An Overview of Systems and Use Cases
作者:Guohui Xiao, Linfang Ding, Benjamin Cogrel & Diego Calvanese
供稿:Guohui Xiao
編者按:Data Intelligence 發表意大利博爾扎諾自由大學人工智能領域國際知名學者Diego Calvanese 教授組對近十年內虛擬知識圖譜領域研究成果總結:Virtual Knowledge Graphs: An Overview of Systems and Use Cases(虛擬知識圖譜:軟件系統和應用案例綜述)。虛擬知識圖譜技術,也稱“基于本體的數據訪問技術”(ontology-based data access,OBDA),可將現有的數據庫虛擬化為知識圖譜。虛擬化的知識圖譜通過提供一種高層次的查詢接口,使最終用戶不需關心底層的數據存儲和組織,特別適用于數據集成領域。本文第一作者意大利博爾扎諾自由大學計算機學院Guohui Xiao (肖國輝) 博士,專攻VKG/OBDA理論和技術,是當今最先進的VKG/OBDA系統 Ontop 研究團隊的負責人,主持Ontop的研究、開發和應用。肖國輝博士也是Ontopic初創公司的聯合創始人和首席科學家,公司致力于將虛擬知識圖譜技術引入工業界。請點擊文后“原文鏈接”閱讀原文。
文章總結:
??? 數據驅動對于公司和組織機構保持競爭力至關重要。然而大中型企業和組織經常面臨處理大量復雜數據集的挑戰。尤其是這些企業和組織中的架構和職能劃分造成了數據孤島,常有冗余和不一致的信息。實際中有很強的需求將這些數據孤島集成,以用來支持數據分析和決策。
?? 數據集成通常是耗時,昂貴但又必不可少的活動。從技術角度來看,數據集成工具的主要供應商大多使用標準關系模型集成數據,這種方式缺乏靈活性,導致了可擴展性問題、以及低效率和高成本。由于當前主流技術的局限性,只有一小部分有價值的企業數據得到了適當的整合。因此,許多業務分析師仍然經常需要以低效臨時方式集成所需數據,并且需要花費80%到95%的時間來準備這些數據。
??? 為克服傳統的基于關系模型的數據集成方法的困難,我們在此提出了一種基于虛擬知識圖譜(Virtual Knowledge Graph, VKG)的方法。此方法不是簡單把數據看成一系列的表格,而是將其構建為統一的虛擬知識圖譜。虛擬知識圖譜VKG方法結合了三個想法:
???數據虛擬化(Virtualization)避免了向最終用戶暴露原始數據源。集成后的數據相當于原始數據上的一個視圖,通常不需要固化,而是可以保持虛擬化。這樣避免了固化視圖數據的時間和額外的存儲空間。由于可以即時測試和修改這些視圖,VKG大大簡化了數據集成的設計和維護。
???集成后數據以圖(Graph)的形式建模。圖中節點表示實體、數據值或者類,邊表示節點之間的關系。圖的結構提供了比傳統關系表更多的靈活性,這在數據集成中尤為重要。給定兩個或多個圖,通過簡單的合并相同的節點,即可以完成數據融合,并且融合的結果仍然是圖。
???領域知識(Knowledge)可以進一步豐富圖的數據,例如領域知識可以表示概念和屬性層次結構、關系的定義域和值域。這些知識允許人們對數據和知識進行推理,從而從明確聲明的知識中獲得衍生知識。
? 在文獻中,VKG方法也被稱為基于本體的數據訪問(Ontology-basedData Access, OBDA)。近十年來,VKG/OBDA的理論和技術發展迅猛。VKG的核心技術是查詢推理引擎,通常通過查詢重寫的方式來將用戶在虛擬知識圖譜上的查詢轉換為原始數據源的查詢。VKG技術在學術界和工業界都有廣泛的應用。本文詳細總結了VKG技術的軟件生態圈和應用案例。
作者簡介:
Guohui Xiao (肖國輝)是意大利博爾扎諾自由大學KRDB知識與數據研究中心助理教授。他分別于2007年和2010年獲得北京大學的學士和碩士學位,并于2014年獲得奧地利維也納技術大學計算機科學博士學位。他的主要研究興趣包括知識表示、描述邏輯、語義網、數據庫理論和虛擬知識圖譜。他是Ontopic初創公司的聯合創始人,公司致力于將虛擬知識圖譜技術引入工業界。
Linfang Ding (丁林芳) 是意大利博爾扎諾自由大學KRDB知識與數據研究中心博士后研究員。她分別于2007年和2010年獲得北京大學的學士和碩士學位,并于2016年獲得德國慕尼黑工業大學的博士學位。她的研究興趣包括地理信息科學、地圖學、地理本體、虛擬知識圖譜和地理可視化分析。
Benjamin Cogrel是意大利博爾扎諾自由大學KRDB知識與數據研究中心博士后研究員。他于2013年在東巴黎大學 (University of Paris-Est) 獲得博士學位。他的研究興趣包括虛擬知識圖譜、數據集成和語義網。他是Ontopic初創公司的聯合創始人,公司致力于將虛擬知識圖譜技術引入工業界。
Diego Calvanese 是意大利博爾扎諾自由大學KRDB知識與數據研究中心教授。他的研究興趣包括知識表示和形式化推理、虛擬知識圖譜、本體語言、描述邏輯、概念數據建模和數據集成。 他是“描述邏輯手冊”的編輯之一。他自2015年起為歐洲人工智能協會(EurAI)成員。他是Ontopic初創公司的聯合創始人,公司致力于將虛擬知識圖譜技術引入工業界。
OpenKG
開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
總結
以上是生活随笔為你收集整理的论文浅尝 | 虚拟知识图谱:软件系统和应用案例综述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 - ICML2020 | 基于
- 下一篇: 论文浅尝 - AAAI2021 | 从历