装备保障性验证知识图谱构建方法研究-学习笔记
裝備保障性驗證知識圖譜構建方法研究
領域知識圖譜構建
在邏輯層面,知識圖譜通常可以劃分為數據層和模式層兩個層次。數據層主要是將領域中的多源異構數據轉換為三元組的形式,通過一系列三元組表達領域知識或者常識知識,比如用(實體1,關系,實體2)、(實體、屬性,屬性值)這樣的三元 組來表達事實,從而實現對知識進行存儲。模式層是在數據層的基礎上構建的,領域知識圖譜構建過程通常通過構建領域本體(Ontology)來規范數據層。本體規范了領域核心結構,具有較強的結構層次,有效減少冗余。
由于垂直領域知識圖譜對領域知識準確性以及領域知識之間深層次關系要求較高,因此一般采用自頂向下構建方式。
雖然垂直領域知識圖譜一般面向不同的特定領域和不同的數據模式,現在沒有統一的構建標準和規范。但是一般構建過程可以分為六個階段,即知識建模、知識存儲、知識抽取、知識融合、知識計算、知識應用。
面向裝備保障性驗證的知識圖譜構建
裝備保障性驗證知識圖譜構建技術流程。
D2R將關系數據庫中的數據映射到RDF(資源描述框架,表示為三元組形式,RDF本質是一種數據模型(Data Model),RDF假設所有語義都可以以三元組形式進行表示,復雜語義可以由n個三元 組組合表示,它提供了一種統一的描述實體、概念、屬性的標準,形式上表示為SPO三元組形式)中。
KBP(知識庫填充,關系抽取語料)KBP 評測由文本分析會議主辦,其目標是開發和評估從非結構化文本中獲取知識填充知識庫的技術。KBP 評測覆蓋了知識庫填充的獨立子任務以及被稱為“冷啟動”的端到端知識庫構建任務。
采用應用最為廣泛的OWA形式化定義進行裝備保障性驗證領域本體建模。
C是領域概念集; A是概念的屬性集;R 是關系集;A 是每個關系屬性集; H表示概念層次;X 表示公理集。
基于本體的保障性驗證系統分析的核心在于:在OWA形式化規范下逐層確定裝備保障系統概念和概念之間的關系。 如此逐層分析,直至確定研究目的下所定義的最小細粒度概念。 在概念分析的過程中會逐層體現所需建立的模型。
多源異構裝備保障性實體抽取和實體關系構建包括裝備保障性驗證知識抽取、關系鏈接、關系推理等。
保障性驗證領域知識的來源包括裝備保障本體庫、基礎裝備保障性數據、與裝備保障性相關的國軍標、裝備保障性相關的科研項目成果(報告、模型)、試驗基地的歷史數據等??蓮闹刑崛⊙b備保障性驗證相關概念、裝備保障性驗證實體、裝備保障性驗證相關屬性、語義關系、空間關系、時間關系。
時間關系主要描述在裝備壽命周期各階段裝備保障性驗證所處的不同狀態以及任務屬性。對時間關系的形式化描述可分為兩類,
一類是裝備保障性驗證事件、過程等實體之間的時變關系描述,如事件:“在裝備設計階段,裝備設計人員需要考慮加油口蓋消沫功能”可對抽取得到的三元組“設計人—設計—加油口蓋消沫功能”添加時間標簽拓展為四元組,用來描述時間;
第二類是空間特征的時間變化屬性??捎糜趯嶓w和關系的更新,如裝備進行長途奔襲過程中,裝備的空間屬性值以及裝備狀態屬性值是隨時間而變化的,這也是未來構建動態知識圖譜的時間軸基礎。
經過知識抽取得到的知識可以劃分為本體層(抽象知識)和實例層(具體事實)。
雖然通過本體建模的方式構 建了裝備保障性驗證領域的本體模型,但是事實上,無法構建出一個能夠包含全方面的統一本體,因為面向不同應用場景以及面向不同的用戶使得不同本體之間有不同側重點和差異。大量實例之間也存在異構性問題。
由于知識之間可能存在冗余和錯誤的情況,需要通過知識融合來解決本體層和實例層異構問題,以提高知識質量和精度。
如圖描述了本體映射的基本過程。
基于術語:自然語言處理技術,比較映射對象之間的相似度
基于術語的本體映射
? ? ? ? ? ? ?基于字符串
? ? ? ? ? ? ? ? ? ? ? (1)規范化
? ? ? ? ? ? ? ? ? ? ? (2)相似度量方法:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 漢明距離:計算字符出現位置的不同
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 子串相似度
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 編輯距離:修改其中一個使之與另一個相同所需的最小操作代價
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 路徑距離:考慮父概念
基于規則的實例匹配
基于EM算法的半監督學習框架----自動尋找實例匹配規則
該框架以迭代的方式自動發現匹配規則,逐步提高匹配規則集的質量,再利用跟新后的規則集來尋找高質量的匹配對。
在規范字符串的基礎上,通過度量字符串的相似程度判斷本體的映射關系,可以使用以下四種方法度量字符串相似度。
導入的任意兩個本體字符s和t。
若存在兩個字符串p和q使得s=p+t+q或t=p+s+q,則稱t是s的子串或s是t的子串,令x為s和t的最大公共子串,則s和t的子串相似度為:
若給定一個字符串操作集合op和一個代價函數w,對于任意一對字符串s和t,存在將s轉化為t的操作序列集合,則兩字符串的編輯距離為:
若給定兩個字符串序列,則路徑距離計算,是某字符串度量函數
裝備保障性驗證知識圖譜應用
?
總結
以上是生活随笔為你收集整理的装备保障性验证知识图谱构建方法研究-学习笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: KnowIME: A System to
- 下一篇: 华为matepad2023柔光版和华为m