知识图谱相关了解
1. 知識(shí)是什么?
首先要明確.。知識(shí)是人類對信息進(jìn)行處理之后的認(rèn)識(shí)和理解,是對數(shù)據(jù)和信息的凝煉、總結(jié)后的成果,而不是簡單的數(shù)據(jù)。
2. 圖是什么?
圖表示一些事物(Object)與另一些事物之間相互連接的結(jié)構(gòu)。
一張圖通常由一些結(jié)點(diǎn)(Vertice或Node)和連接這些結(jié)點(diǎn)的邊(Edge)組成。
3. 基本概念
-
實(shí)體:對應(yīng)一個(gè)語義本體,例如“姚明”“中國”等。
-
屬性:描述一類實(shí)體的特性(例如“身高”:姚明的身高是229厘米)。
-
關(guān)系:對應(yīng)語義本體之間的關(guān)系,將實(shí)體連接起來(例如“國籍”:姚明的國籍是中國)。
?4. 知識(shí)圖譜是什么?
知識(shí)圖譜就是用圖的形式將知識(shí)表示出來。圖中的結(jié)點(diǎn)代表語義實(shí)體或概念,邊代表結(jié)點(diǎn)間的各種語義關(guān)系。
比如,<姚明,國籍,中國>表示姚明的國籍是中國,其中“姚明”和“中國”是兩個(gè)結(jié)點(diǎn),而結(jié)點(diǎn)間的關(guān)系是“國籍”。
知識(shí)圖譜的歷程:
- 20世紀(jì)80年代,研究人員將哲學(xué)概念本體(Ontology)引入計(jì)算機(jī)領(lǐng)域,作為“概念和關(guān)系的形式化描述”, 后來,Ontology也被用于為知識(shí)圖譜定義知識(shí)體系(Schema)。
- 真正對知識(shí)圖譜產(chǎn)生深遠(yuǎn)影響的是Web的誕生。Tim Berners-Lee在1989年發(fā)表的“Information Management: A Proposal”[4]中提出了Web的愿景, Web應(yīng)該是一個(gè)以“鏈接”為中心的信息系統(tǒng)(Linked Information System),以圖的方式相互關(guān)聯(lián)。?
- 在1998年,Tim正式提出語義網(wǎng)(Semantic Web)的概念。語義網(wǎng)是一種數(shù)據(jù)互連的語義網(wǎng)絡(luò),它仍然基于圖和鏈接的組織方式,但圖中的結(jié)點(diǎn)不再是網(wǎng)頁,而是實(shí)體。
- 通過為全球信息網(wǎng)上的文檔添加“元數(shù)據(jù)”(Meta Data),讓計(jì)算機(jī)能夠輕松理解網(wǎng)頁中的語義信息,從而使整個(gè)互聯(lián)網(wǎng)成為一個(gè)通用的信息交換媒介。我們可以將語義網(wǎng)理解為知識(shí)的互聯(lián)網(wǎng)(Web of Knowledge)或者事物的互聯(lián)網(wǎng)(Web of Thing)。
- 2006年,Tim又提出了鏈接數(shù)據(jù)(Linked Data)的概念,進(jìn)一步強(qiáng)調(diào)了數(shù)據(jù)之間的鏈接,而不僅僅是文本的數(shù)據(jù)化。后文還會(huì)介紹鏈接開放數(shù)據(jù)(Linked Open Data,LOD)項(xiàng)目,它也是為了實(shí)現(xiàn)Tim有關(guān)鏈接數(shù)據(jù)作為語義網(wǎng)的一種實(shí)現(xiàn)的設(shè)想。
- 知識(shí)圖譜的概念是和Web、自然語言處理(NLP)、知識(shí)表示(KR)、數(shù)據(jù)庫(DB)、人工智能(AI)等密切相關(guān)的。
————
參考資料:《從零構(gòu)建知識(shí)圖譜:技術(shù)、方法與案例》,機(jī)械工業(yè)出版社華章公司2021年出版
總結(jié)
- 上一篇: 【Python】特征选择方法
- 下一篇: 物理约束相关问题梳理