Ontology的研究和应用
生活随笔
收集整理的這篇文章主要介紹了
Ontology的研究和应用
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
Ontology的研究和應(yīng)用主要包括以下3方面:
?? ? ? ? 理論上的研究,主要研究概念及其分類,Ontology上的代數(shù);
?? ? ? ? 信息系統(tǒng)中的應(yīng)用,主要包括處理信息組織、信息檢索和異構(gòu)信息系統(tǒng)互操作問題;
?? ? ? ? Ontology作為一種能在知識(shí)層提供知識(shí)共享和重用的工具在語義Web中的應(yīng)用。
Ontology的理論研究包括概念和概念分類、Ontology上的代數(shù)。最有代表性的是Guarino等人對(duì)概念的分類所做的深入和細(xì)致的研究,他們從一般的意義上分析了什么是概念、概念的特性、概念之間的關(guān)系以及概念的分類,提出了一套用于指導(dǎo)概念分類的可行理論。基于這個(gè)理論,他又提出了Ontology驅(qū)動(dòng)的建模方法,在理論上為建模提供了一個(gè)通用的模式。
Guarino的理論可以歸納如下[27]:
概念分類理論的基礎(chǔ)是概念的元特性。以概念的元特性為出發(fā)點(diǎn),按照一定的規(guī)則,把具有相同元特性組合的概念歸為一類,進(jìn)而給出一般意義上的概念分類體系。概念的基本元特性包括:持久特性、非持久特性、反持久特性、半持久特性、載體標(biāo)識(shí)特性、支持標(biāo)識(shí)特性、外部依賴特性等。表2.1是對(duì)其特性的說明:
表2.1??本體概念的基本元特性
Table2.1 Basic meta character of Ontology conception
名稱? ? ? ? 描述? ? ? ? 舉例
持久特性? ? ? ? 嚴(yán)格定義為: 。
代表某個(gè)概念, 代表x是 的一個(gè)實(shí)例, 表示其后的斷言永遠(yuǎn)為真。? ? ? ? Person具有持久性,而Student不具有持久性。
非持久特性? ? ? ? 對(duì)某個(gè)概念而言,存在某些實(shí)例不會(huì)永遠(yuǎn)屬于該概念。? ? ? ? Student具有非持久性。
反持久特性? ? ? ? 對(duì)概念的任何一個(gè)實(shí)例,這個(gè)實(shí)例不會(huì)永遠(yuǎn)屬于該概念。? ? ? ? Youth具有反持久性。
半持久特性? ? ? ? 非持久性和反持久性的差集。? ? ? ? ——
載體標(biāo)識(shí)特性? ? ? ? ——? ? ? ? 如Student具有載體標(biāo)識(shí)特性,因?yàn)閷W(xué)生之間的區(qū)別不是靠學(xué)生,而是作為人來區(qū)分的。
支持標(biāo)識(shí)特性? ? ? ? 每個(gè)實(shí)例相互之間是可以區(qū)分的。? ? ? ? Person具有支持標(biāo)識(shí)特性,人和人之間可由標(biāo)識(shí)(人的指紋)來區(qū)分。
名稱? ? ? ? 描述? ? ? ? 舉例
外部依賴特性? ? ? ? 一個(gè)概念對(duì)另外一個(gè)概念的某種依賴關(guān)系。概念A(yù)對(duì)概念B的外在依賴關(guān)系表現(xiàn)為概念A(yù)中的任何一個(gè)實(shí)例a必蘊(yùn)涵屬于概念B的實(shí)例b,而b不是a的一部分。? ? ? ? Parent外在依賴于Child,某人的父母蘊(yùn)涵他(她)有小孩,而他的小孩當(dāng)然不是他身體的一部分。
Guarino 等人提出的概念分類體系,不僅從理論上澄清了概念分類上存在的模糊和混淆的現(xiàn)象,同時(shí)為實(shí)際應(yīng)用中Ontology 概念模型的建立提供了良好的分析、設(shè)計(jì)和評(píng)估的手段。
在信息檢索技術(shù)方面,可分為3 類[28 ]:全文檢索(Text retrieval) 、數(shù)據(jù)檢索(Data retrieval) 和知識(shí)檢索(Knowledge retrieval)。全文檢索的特點(diǎn)是把用戶的查詢請(qǐng)求和全文中的每一個(gè)詞進(jìn)行比較,不考慮查詢請(qǐng)求與文件語義上的匹配,這種方式雖然可以保證查全率,但是查準(zhǔn)率卻大大地降低了。數(shù)據(jù)檢索的特點(diǎn)是查詢要求和信息系統(tǒng)中的數(shù)據(jù)都遵循一定的格式,具有一定的結(jié)構(gòu),允許對(duì)特定的字段檢索。數(shù)據(jù)檢索需要有標(biāo)識(shí)字段的方法。數(shù)據(jù)檢索的性能取決于所使用的標(biāo)識(shí)字段的方法和用戶對(duì)這種方法的理解,因此具有很大的局限性。數(shù)據(jù)檢索支持語義匹配的能力也較差。知識(shí)檢索強(qiáng)調(diào)的是基于知識(shí)的、語義上的匹配,因此在查準(zhǔn)率和查全率上有更好的保證。目前知識(shí)檢索是信息檢索研究的重點(diǎn),特別是面向Web 信息的知識(shí)檢索。
常規(guī)的直接基于關(guān)鍵詞的信息檢索技術(shù)已不能滿足用戶在語義上和知識(shí)上的需求,尋找新的方法也就成為目前研究的熱點(diǎn)。Ontology 具有的良好的概念層次結(jié)構(gòu)和對(duì)邏輯推理的支持,因而在信息檢索,特別是在基于知識(shí)的檢索中得到了廣泛的應(yīng)用[28 ,29 ] 。基于Ontology 的信息檢索的基本設(shè)計(jì)思想可以總結(jié)如下:
(1) 在領(lǐng)域?qū)<业膸椭?#xff0c;建立相關(guān)領(lǐng)域的Ontology。
(2) 收集信息源中的數(shù)據(jù),并參照已建立的Ontology,把收集來的數(shù)據(jù)按規(guī)定的格式存儲(chǔ)在元數(shù)據(jù)庫(關(guān)系數(shù)據(jù)庫、知識(shí)庫等) 中。
(3) 對(duì)用戶檢索界面獲取的查詢請(qǐng)求,查詢轉(zhuǎn)換器按照Ontology 把查詢請(qǐng)求轉(zhuǎn)換成規(guī)定的格式,在Ontology 的幫助下從元數(shù)據(jù)庫中匹配出符合條件的數(shù)據(jù)集合。
(4) 檢索的結(jié)果經(jīng)過定制處理后,返回給用戶。
需要說明的是,如果檢索系統(tǒng)不需要太強(qiáng)的推理能力,Ontology 可用概念圖的形式表示并存儲(chǔ),數(shù)據(jù)可以保存在一般的關(guān)系數(shù)據(jù)庫中,采用圖的匹配技術(shù)來完成信息檢索。如果要求比較強(qiáng)的推理能力,一般需要用一種描述語(如:Loom ,Ontolingua 等) 表示Ontology,數(shù)據(jù)保存在知識(shí)庫中,采用描述語言的邏輯推理能力來完成信息檢索。由于Ontology 能通過概念之間的關(guān)系來表達(dá)概念語義的能力,所以能夠提高檢索的查全率和查準(zhǔn)率。
目前Ontology 應(yīng)用在信息檢索中的著名項(xiàng)目包括(Onto) 2 Agent、Ontobroker 和SKC 。這3 個(gè)項(xiàng)目也分別代表了3 個(gè)方向。(Onto) 2 Agent 的目的是為了幫助用戶檢索到所需要的WWW上已有的Ontology,主要采用了參照Ontology。參照Ontology 是以WWW上已有的Ontology 為對(duì)象建立起來的Ontology,它保存有各類Ontology 的元數(shù)據(jù)。Ontobroker 面向的是WWW上的網(wǎng)頁資源,目的是為用戶檢索到所需要的網(wǎng)頁,這些網(wǎng)頁含有用戶所關(guān)心的內(nèi)容。SKC 是一個(gè)正在進(jìn)行的項(xiàng)目,其目標(biāo)是解決信息系統(tǒng)語義異構(gòu)的問題,實(shí)現(xiàn)異構(gòu)的自治系統(tǒng)之間的互操作。該項(xiàng)目希望通過在Ontology 上建立一個(gè)代數(shù)系統(tǒng),用這個(gè)代數(shù)系統(tǒng)來實(shí)現(xiàn)各Ontology 之間的互操作,從而實(shí)現(xiàn)異構(gòu)系統(tǒng)之間的互操作。
關(guān)于Ontology在語義Web中的應(yīng)用將在下節(jié)中做以闡述。
?? ? ? ? 理論上的研究,主要研究概念及其分類,Ontology上的代數(shù);
?? ? ? ? 信息系統(tǒng)中的應(yīng)用,主要包括處理信息組織、信息檢索和異構(gòu)信息系統(tǒng)互操作問題;
?? ? ? ? Ontology作為一種能在知識(shí)層提供知識(shí)共享和重用的工具在語義Web中的應(yīng)用。
Ontology的理論研究包括概念和概念分類、Ontology上的代數(shù)。最有代表性的是Guarino等人對(duì)概念的分類所做的深入和細(xì)致的研究,他們從一般的意義上分析了什么是概念、概念的特性、概念之間的關(guān)系以及概念的分類,提出了一套用于指導(dǎo)概念分類的可行理論。基于這個(gè)理論,他又提出了Ontology驅(qū)動(dòng)的建模方法,在理論上為建模提供了一個(gè)通用的模式。
Guarino的理論可以歸納如下[27]:
概念分類理論的基礎(chǔ)是概念的元特性。以概念的元特性為出發(fā)點(diǎn),按照一定的規(guī)則,把具有相同元特性組合的概念歸為一類,進(jìn)而給出一般意義上的概念分類體系。概念的基本元特性包括:持久特性、非持久特性、反持久特性、半持久特性、載體標(biāo)識(shí)特性、支持標(biāo)識(shí)特性、外部依賴特性等。表2.1是對(duì)其特性的說明:
表2.1??本體概念的基本元特性
Table2.1 Basic meta character of Ontology conception
名稱? ? ? ? 描述? ? ? ? 舉例
持久特性? ? ? ? 嚴(yán)格定義為: 。
代表某個(gè)概念, 代表x是 的一個(gè)實(shí)例, 表示其后的斷言永遠(yuǎn)為真。? ? ? ? Person具有持久性,而Student不具有持久性。
非持久特性? ? ? ? 對(duì)某個(gè)概念而言,存在某些實(shí)例不會(huì)永遠(yuǎn)屬于該概念。? ? ? ? Student具有非持久性。
反持久特性? ? ? ? 對(duì)概念的任何一個(gè)實(shí)例,這個(gè)實(shí)例不會(huì)永遠(yuǎn)屬于該概念。? ? ? ? Youth具有反持久性。
半持久特性? ? ? ? 非持久性和反持久性的差集。? ? ? ? ——
載體標(biāo)識(shí)特性? ? ? ? ——? ? ? ? 如Student具有載體標(biāo)識(shí)特性,因?yàn)閷W(xué)生之間的區(qū)別不是靠學(xué)生,而是作為人來區(qū)分的。
支持標(biāo)識(shí)特性? ? ? ? 每個(gè)實(shí)例相互之間是可以區(qū)分的。? ? ? ? Person具有支持標(biāo)識(shí)特性,人和人之間可由標(biāo)識(shí)(人的指紋)來區(qū)分。
名稱? ? ? ? 描述? ? ? ? 舉例
外部依賴特性? ? ? ? 一個(gè)概念對(duì)另外一個(gè)概念的某種依賴關(guān)系。概念A(yù)對(duì)概念B的外在依賴關(guān)系表現(xiàn)為概念A(yù)中的任何一個(gè)實(shí)例a必蘊(yùn)涵屬于概念B的實(shí)例b,而b不是a的一部分。? ? ? ? Parent外在依賴于Child,某人的父母蘊(yùn)涵他(她)有小孩,而他的小孩當(dāng)然不是他身體的一部分。
Guarino 等人提出的概念分類體系,不僅從理論上澄清了概念分類上存在的模糊和混淆的現(xiàn)象,同時(shí)為實(shí)際應(yīng)用中Ontology 概念模型的建立提供了良好的分析、設(shè)計(jì)和評(píng)估的手段。
在信息檢索技術(shù)方面,可分為3 類[28 ]:全文檢索(Text retrieval) 、數(shù)據(jù)檢索(Data retrieval) 和知識(shí)檢索(Knowledge retrieval)。全文檢索的特點(diǎn)是把用戶的查詢請(qǐng)求和全文中的每一個(gè)詞進(jìn)行比較,不考慮查詢請(qǐng)求與文件語義上的匹配,這種方式雖然可以保證查全率,但是查準(zhǔn)率卻大大地降低了。數(shù)據(jù)檢索的特點(diǎn)是查詢要求和信息系統(tǒng)中的數(shù)據(jù)都遵循一定的格式,具有一定的結(jié)構(gòu),允許對(duì)特定的字段檢索。數(shù)據(jù)檢索需要有標(biāo)識(shí)字段的方法。數(shù)據(jù)檢索的性能取決于所使用的標(biāo)識(shí)字段的方法和用戶對(duì)這種方法的理解,因此具有很大的局限性。數(shù)據(jù)檢索支持語義匹配的能力也較差。知識(shí)檢索強(qiáng)調(diào)的是基于知識(shí)的、語義上的匹配,因此在查準(zhǔn)率和查全率上有更好的保證。目前知識(shí)檢索是信息檢索研究的重點(diǎn),特別是面向Web 信息的知識(shí)檢索。
常規(guī)的直接基于關(guān)鍵詞的信息檢索技術(shù)已不能滿足用戶在語義上和知識(shí)上的需求,尋找新的方法也就成為目前研究的熱點(diǎn)。Ontology 具有的良好的概念層次結(jié)構(gòu)和對(duì)邏輯推理的支持,因而在信息檢索,特別是在基于知識(shí)的檢索中得到了廣泛的應(yīng)用[28 ,29 ] 。基于Ontology 的信息檢索的基本設(shè)計(jì)思想可以總結(jié)如下:
(1) 在領(lǐng)域?qū)<业膸椭?#xff0c;建立相關(guān)領(lǐng)域的Ontology。
(2) 收集信息源中的數(shù)據(jù),并參照已建立的Ontology,把收集來的數(shù)據(jù)按規(guī)定的格式存儲(chǔ)在元數(shù)據(jù)庫(關(guān)系數(shù)據(jù)庫、知識(shí)庫等) 中。
(3) 對(duì)用戶檢索界面獲取的查詢請(qǐng)求,查詢轉(zhuǎn)換器按照Ontology 把查詢請(qǐng)求轉(zhuǎn)換成規(guī)定的格式,在Ontology 的幫助下從元數(shù)據(jù)庫中匹配出符合條件的數(shù)據(jù)集合。
(4) 檢索的結(jié)果經(jīng)過定制處理后,返回給用戶。
需要說明的是,如果檢索系統(tǒng)不需要太強(qiáng)的推理能力,Ontology 可用概念圖的形式表示并存儲(chǔ),數(shù)據(jù)可以保存在一般的關(guān)系數(shù)據(jù)庫中,采用圖的匹配技術(shù)來完成信息檢索。如果要求比較強(qiáng)的推理能力,一般需要用一種描述語(如:Loom ,Ontolingua 等) 表示Ontology,數(shù)據(jù)保存在知識(shí)庫中,采用描述語言的邏輯推理能力來完成信息檢索。由于Ontology 能通過概念之間的關(guān)系來表達(dá)概念語義的能力,所以能夠提高檢索的查全率和查準(zhǔn)率。
目前Ontology 應(yīng)用在信息檢索中的著名項(xiàng)目包括(Onto) 2 Agent、Ontobroker 和SKC 。這3 個(gè)項(xiàng)目也分別代表了3 個(gè)方向。(Onto) 2 Agent 的目的是為了幫助用戶檢索到所需要的WWW上已有的Ontology,主要采用了參照Ontology。參照Ontology 是以WWW上已有的Ontology 為對(duì)象建立起來的Ontology,它保存有各類Ontology 的元數(shù)據(jù)。Ontobroker 面向的是WWW上的網(wǎng)頁資源,目的是為用戶檢索到所需要的網(wǎng)頁,這些網(wǎng)頁含有用戶所關(guān)心的內(nèi)容。SKC 是一個(gè)正在進(jìn)行的項(xiàng)目,其目標(biāo)是解決信息系統(tǒng)語義異構(gòu)的問題,實(shí)現(xiàn)異構(gòu)的自治系統(tǒng)之間的互操作。該項(xiàng)目希望通過在Ontology 上建立一個(gè)代數(shù)系統(tǒng),用這個(gè)代數(shù)系統(tǒng)來實(shí)現(xiàn)各Ontology 之間的互操作,從而實(shí)現(xiàn)異構(gòu)系統(tǒng)之間的互操作。
關(guān)于Ontology在語義Web中的應(yīng)用將在下節(jié)中做以闡述。
總結(jié)
以上是生活随笔為你收集整理的Ontology的研究和应用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: xml 验证
- 下一篇: 关于webservice的经典理解