虚拟专题:知识图谱 | 流程工业控制系统的知识图谱构建
來源:智能科學與技術學報
流程工業控制系統的知識圖譜構建
牟天昊1,?李少遠1,2
1?上海交通大學電子信息與電氣工程學院
2?上海交通大學系統控制與信息處理教育部重點實驗室
?摘要:近年來,工業控制系統智能化的趨勢方興未艾,相關新技術新思想不斷被提出。知識圖譜是人工智能應用的基礎資源,構建專業領域知識圖譜已經成為研究熱點。然而,控制系統知識圖譜構建尚處于發展初期。對控制系統的結構特點和任務要求進行分析,給出控制系統的知識圖譜構建的方法框架。首先對已有的流程工業控制系統知識圖譜構建的工作進行總結,闡述了工業控制系統的特點,給出了控制系統知識圖譜構建的基本原則和流程,并以控制系統信息物理資產管理任務為例進行了詳細的知識圖譜構建說明。最后,對未來的研究方向進行了展望。
關鍵詞:控制系統 ; 領域知識圖譜 ; 物理信息系統 ; 構建技術
論文引用格式:
牟天昊, 李少遠. 流程工業控制系統的知識圖譜構建[J]. 智能科學與技術學報, 2022, 4(1): 129-141.
MOU T H, LI S Y. Knowledge graph construction for control systems in process industry[J]. Chinese Journal of Intelligent Science and Technology, 2022, 4(1): 129-141.
0 引言
2011 年,國際商業機器公司(international business machines corporation,IBM)的Watson贏得“Jeopardy”電視智力競賽,用于支持其知識發現的知識圖譜技術引發了研究者的廣泛關注;2012年谷歌公司發布了包含570億實體的大規模知識圖譜,展示了知識圖譜在知識工程中的巨大應用潛力。在剛剛過去的 10 年間,知識圖譜因為其處理多源異構數據的能力、高效的知識檢索、深入的知識挖掘和分析以及直觀的知識可視化的能力,受到了學術界和工業界的廣泛關注,取得了迅猛的發展。
知識圖譜可以定義為由實體(節點)和關系(邊)組成的多關系的圖形知識庫。在知識圖譜中,知識以三元組(實體-關系-實體或者實體-屬性-值)的形式存儲。按照知識領域和應用范圍的不同,知識圖譜可以分為通用知識圖譜和領域知識圖譜。通用知識圖譜涉及知識范圍廣,知識量大,且多為常識知識,已經有DBpedia、Freebase、YAGO、NELL等代表性的工作;在領域知識圖譜上,出現了一批針對醫療、教育、金融和社會研究領域知識圖譜構建和應用的工作。
毫無疑問,知識圖譜在知識存儲和應用上的強大能力也吸引了控制領域的學者。這是因為,在實際的流程工業控制系統中,人員、物料、裝置和設備、能量流等生產要素和它們之間的關聯關系中包含了系統正常運行所依賴的知識。知識圖譜作為一種關系型知識的有力表達形式,有望提升控制系統的知識自動化的程度。一方面,知識圖譜可作為信息集成平臺,對各生產要素及其關系進行統一的表達,從而成為解決生產過程的信息感知集成和人機物協同問題的基礎資源之一;另一方面,知識圖譜能夠實現知識存儲、知識檢索和知識推理,能為操作人員提供知識查詢服務,還可以為生產指標預測、運行狀態檢測和故障診斷提供支持,從而實現信息物理系統的自感知。
在控制系統領域,有一些針對特定對象特定任務的知識圖譜構建的文章陸續發表。比如,Mao S等人針對延遲焦化生產過程中的風險分析和安全控制問題,構建了過程安全知識圖譜;Zhou L等人設計了面向石油化工生產過程仿真的本體,并在此基礎上構建了柴油生產知識圖譜;Chen Z Y等人針對冷滾軋生產過程的鋼帶斷裂問題,提取了相關特征并構建了知識圖譜,實現了鋼帶斷裂的建模;Shen G W等人針對工業控制系統的網絡安全問題,利用數據驅動的關系提取方法,構建了工業控制系統的網絡安全知識圖譜。然而,目前有關控制系統的知識圖譜構建的研究多聚焦于控制系統的某個具體任務,尚無綜述文章對這個主題進行系統深入的分析和總結。另外,現有的知識圖譜構建方面的綜述文章多關注于通用知識圖譜構建技術,注意力多放在知識圖譜構建的一般性技術上。本文基于以上出發點,希望對控制系統的結構特點和任務要求進行分析,進而提出面向控制系統的知識圖譜構建的一般性方法框架。
本文結構如下:第1節簡要介紹領域知識圖譜構建的一般方法,介紹控制系統的結構特點和任務特點,并給出控制系統知識圖譜構建的基本原則和一般框架;第2節以信息物理資產管理的具體任務為例,詳細闡明控制系統的知識圖譜構建的具體方法和流程;第3節給出未來可能的研究方向;第4節對全文進行總結。
1 流程工業控制系統知識圖譜的構建方法
1.1 領域知識圖譜構建的一般方法
知識圖譜可以分為數據層和模式層。數據層包含具體的知識實例。模式層通常指知識圖譜的本體,其中定義了概念和關系的類型、屬性和范圍。根據構建數據層和模式層的先后順序,知識圖譜構建分為兩種方法:自底向上和自頂向下。自底向上的方法直接從結構化數據、半結構化數據和其他知識庫中進行知識抽取,對抽取到的實體、關系和屬性進行審核后將其加入知識圖譜,再構建上層的本體。自頂向下的方法首先根據專家經驗構建領域本體,然后在本體的約束下將知識實例加入知識圖譜。自頂向下的方法能保證知識圖譜中的實體之間滿足良好的層次結構,減少錯誤和歧義,但是對人工經驗的依賴性較大,設計本體也可能是一項繁重的任務。自底向上的方法適用于從大量數據中抽取知識。但是,自底向上的方法提取的知識圖譜通常精度不高,概念完備性不足,層次結構不清楚。
領域知識圖譜知識深度深,知識精細度細,對知識的準確性要求嚴苛。因此,常采用自頂向下的方法構建領域知識圖譜。比如,Fu L J等人使用自頂向下的方法構建了非傳統機械加工行業的垂直知識圖譜;Liang H等人提出了一種自頂向下的基于KKS (kraftwerk-kennzeichen system)描述框架的發電知識圖譜構建方法;Kou C等人使用七步法的本體構建方法,搭建了應用于航天器發射的領域知識圖譜;Jia Y 等人針對網絡安全知識圖譜的構建,設計了資產本體、漏洞本體和攻擊本體,共包含漏洞、資產、軟件、操作系統、攻擊5個實體類型。近年來,自底向上的知識圖譜構建技術取得了長足發展,一些研究者將自頂向下和自底向上技術結合,希望在保持自頂向下方法的概念層次清晰、準確性高的優勢的同時,又具有自底向上的方法的更新速度快的特點和可以處理大規模非結構化數據的能力。比如,參考文獻在過程安全知識圖譜的本體設計中,首先借助專家經驗構建大部分本體,然后再從關系數據庫和文檔數據(比如操作規程和技術規范)中提取其他本體;參考文獻在進行危化品管理知識圖譜的本體設計時,同樣將專家經驗構建和數據抽取補全結合。
1.2 流程工業控制系統的結構與要求
從功能的角度,工業控制系統可以分為5層結構。參考IEC 62264-1標準,從上到下分別為企業資源層、生產管理層、過程監控層、現場控制層和現場設備層,如圖1所示。不同層的主要功能和聯系如下。
圖1???工業控制系統的功能分層
企業資源層主要包括企業資源管理(enterprise resource planning,ERP)、產品生命周期管理(product lifecycle management,PLM)等功能單元,負責企業和工廠級別的生產計劃,為企業決策層提供決策運行手段。
生產管理層主要包括制造執行系統(manufacturing execution system,MES)、倉庫管理系統(warehouse manage system,WMS)功能單元,用于對生產過程進行管理,如制造數據管理、生產調度管理等。該層接受企業資源層下達的生產計劃,產生車間級別的生產計劃。該層不直接控制生產過程,但是負責監控生產狀態和生產目標,并上報企業資源層。
過程監控層主要包括 SCADA(supervisory control and data acquisition)與人機界面(human machine interface,HMI)功能單元,用于對生產過程數據進行采集與監控,并通過 HMI 系統給操作人員提供監控和控制功能。該層接收生產管理層下達的生產指令,并獲得現場控制層上傳的實時運行數據,給出各回路的設定值。
現場控制層主要包括各類控制單元,如可編程邏輯控制器(programmable logic controller,PLC)、分散控制系統(distributed control system,DCS)控制單元等,用于對各執行設備進行控制。該層接收過程監控層下達的回路設定值,獲得現場設備層上傳的傳感數據,使用模型預測控制(model predictive control,MPC)、比例微分積分(proportional integral differential,PID)等控制算法,產生控制量。
現場設備層主要包括各類過程傳感設備和執行設備單元,用于對生產過程進行感知與操作;該層接收現場控制層的控制量,由執行設備執行控制指令,對工藝流程進行操作。該層的傳感設備收集實時生產數據,并上報現場控制層。
工業控制系統有兩個基本要求:實時性和可靠性。實時性表現為控制系統必須在規定的循環周期內完成任務。可靠性表現為系統必須保證連續工作。從上層到下層,控制系統對實時性和可靠性的要求逐漸提高。一般要求現場控制層和現場設備層的響應時間為毫秒級別。
1.3 流程工業控制系統知識圖譜構建的基本原則
結合前文提到的流程工業控制系統的結構特點和運行要求,知識圖譜構建應當考慮如下的基本原則。
① 知識圖譜應當面向企業資源層、生產管理層、過程監控層的任務需求。這是因為上層的任務涉及的知識范圍更廣,知識多樣性更強,事實性的知識較多,適合用知識圖譜進行知識表示;上層的信息處理能力較強,方便知識圖譜的存儲和使用;上層任務對實時性要求不高,容錯力強,有專業人員參與,適合知識圖譜發揮其知識發現和推理能力。
② 知識圖譜應當采用自頂向下和自底向上結合的構建方法。這是因為:一方面,經驗知識對于流程工業控制系統至關重要,專家參與的自頂向下的構建能充分考慮這部分知識,保證知識的準確性、完備性和層次性;另一方面,流程工業控制系統包含大量以非結構化文本為載體的機理知識和結構化的數據知識,自底向上的方法適合處理這些數據,是對專家經驗的補充。
③ 知識圖譜應當充分考慮控制系統的信息和物理要素。信息物理系統是物理過程與計算過程的整合。隨著通信技術的發展和計算能力的提高,物理與信息的結合將越發緊密,因此從信息物理系統的角度考慮控制系統是必要的。物理層面涉及各類人員、裝置和設備(比如反應釜、閥門、傳感器、邏輯控制器等)、物料以及能量等;信息層面涉及系統層次模型(比如生產過程功能層次、裝置設備的物理層次等)、信息流(包括生產目標和系統設定數據、實時運行和診斷數據、物料和能量需求數據、終端生產指標數據等)、功能模型(包括各類參數估計算法、指標預測算法、生產控制算法和各類專業軟件等)和靜態信息(包括過程機理信息、生產操作信息和設備裝置說明等)等。這些都是控制系統的構成要件,應當在構建知識圖譜的時候按任務需求考慮它們的概念和聯系。
1.4 流程工業控制系統知識圖譜構建的一般框架
基于以上3個構建原則,給出控制系統知識圖譜構建的一般框架,如圖2所示。
圖2???控制系統知識圖譜構建的一般框架
整個框架將自頂向下和自底向上方法結合。在自頂向下部分,由控制領域專家和知識工程師共同構建圖譜的模式層。模式層的構建主要依賴于專家對控制系統的操作和過程的認識,同時可以參考行業標準規范,比如IEC 62264標準中對控制系統功能分層的定義和IEC 62794中對工業控制系統的概念劃分,還可以參考軟件模型,比如Aspen Plus、Aspen HYSYS、PetroFine等商用軟件對過程控制系統的定義。在自底向上部分,構建過程類似于一般的領域知識圖譜構建。針對控制系統中的工業歷史數據庫、結構化數據、半結構化數據和非結構化數據,經過數據集成、知識提取和知識融合步驟,獲得知識實例。針對流程工業非結構化數據中包含的圖、表和公式,尚無高效的自動知識抽取方法,需要手工構建。圖譜構建完成后,需要進行質量評估,再將獲得的知識保存到合適的數據庫中。至此完成知識圖譜的構建。
在自頂向下的專家本體構建的部分,常用的方法包括七步法、骨架法、企業建模法和Methontology 法等。參考文獻中對比了常用的本體構建方法的出發點和適用范圍。以領域本體開發中常用的七步法為例,其步驟主要包括:①確定本體的領域和范圍;②考慮復用現有的本體;③列出知識本體中的重要術語;④定義類和類的等級體系;⑤定義類的屬性;⑥定義屬性的分面;⑦創建實例。Kou C等人給出了使用七步法進行本體設計的一個具體的例子。常用的可視化的知識圖譜構建工具包括 Protégé、OilEd、WebODE和OntoEdit等。
在自底向上的本體構建的部分,需要對第三方數據庫和結構化數據進行數據集成,還需要對半結構化數據(比如控制系統運行日志)和非結構化數據(比如系統說明和操作手冊)進行知識抽取,然后經過實體對齊步驟,獲得知識實例,再從中提取本體。下面對其主要步驟的常用方法和工具進行介紹。
①數據集成是對結構化數據進行格式變換,使其滿足知識圖譜構建的格式要求。常用的數據集成方法包括直接映射(direct mapping,DM)和R2RML。常用的工具包括 D2RQ、MASTRO、Ultrawrap、Morph-RDB等。
②實體抽取就是命名實體識別,旨在從控制系統涉及的數據源中抽取命名實體。實體抽取方法可以分為基于規則、基于統計和基于深度學習三大類。基于規則的方法需要由控制專家和知識工程師來制定規則集,通過將數據與規則集匹配來獲得命名實體。基于統計的方法通過使用語料庫訓練統計模型來計算某個詞是命名實體的概率。常用的方法包括條件隨機場模型(conditional random field,CRF)、最大熵模型、隱馬爾可夫模型、條件馬爾可夫模型和決策樹方法等。基于深度學習的方法使用深度神經網絡自動地從數據中學習隱藏特征,其常用的方法有卷積神經網絡、長短期記憶(long short time memory,LSTM)神經網絡和圖神經網絡。在控制系統知識圖譜的構建中,基于規則的方法適用于規模小、專業性強、結構性好的數據(比如設備清單和系統運行日志);基于統計和深度學習的方法適用于規模大、通用性強、結構性差的數據(比如關于被控對象的介紹)。
③關系和屬性抽取旨在從控制系統涉及的數據源中抽取實體之間的語義關系。抽取方法可以分為基于規則和基于機器學習兩大類。基于規則的方法首先通過人工編輯或者學習獲得模板,然后基于模板匹配對實體關系進行抽取和判別。根據含標簽樣本的多少,基于機器學習的方法又可以分為有監督方法和弱監督方法兩大類。有監督方法包括基于核函數的方法和基于神經網絡的方法等,弱監督方法中具有代表性的是基于距離監督的方法。
④實體消歧旨在消除多個命名實體指代同一個實體或多個實體對應同一個命名實體的情況。比如“PLC#018”和“18 號控制器”均指代號為 18的可編程邏輯控制器;同一個控制系統中可能有多個“監控室”;不同傳感器的“采樣時間”可能不同。目前實體消歧的方法主要分為基于聚類的方法和基于實體鏈接的方法。
質量評估是對新知識的可信度進行評估,保留可信度高的知識,從而保證圖譜的質量。在自動質量評估方面,已有強化學習(reinforcement learning, RL)和Logistic回歸等方法。但是現有的自動評估方法還不能代替人工審核,部分知識仍要由專家進行人工審核。
在數據存儲方面,知識圖譜常用的存儲格式為RDF 表結構數據庫和圖數據庫。RDF 表結構數據庫的優點是簡單直接、容易理解,缺點是占用空間大、增刪改和復雜查詢開銷大。RDF表結構數據庫已經有不少成熟的產品,包括Jena、Oracle和3store等。圖數據庫的優點是對知識圖譜的結構描述明確、支持圖挖掘算法、復雜查詢效率高,缺點是數據更新慢、大節點的處理開銷大。常用的圖數據庫有Neo4j、OrientDB和HyperGraphDB等。此外,劉寶珠等人提出了統一的數據存儲方案,支持兩種數據模型的高效存儲和不同查詢語言的互操作。
2 流程工業控制系統的知識圖譜構建案例——以信息物理資產管理任務為例
本節聚焦流程工業控制系統的信息物理資產管理任務,介紹信息物理資產知識圖譜的構建流程和構建方法。信息物理資產管理的主要任務是從信息物理系統的角度,將控制系統涉及的硬件、軟件和算法信息集成到知識圖譜中,以實現資產信息的高效管理。本節包含知識來源、本體構建、知識抽取、實體消歧和質量評估、知識存儲5個方面。
2.1 知識來源
在知識來源上,用于構建信息物理資產知識圖譜的知識可以分為兩部分:開放性知識和特異性知識。開放性知識指與控制系統相關,能夠在外部語料中找到的知識。特異性知識指與控制系統相關,但是無法在外部語料庫找到的知識,這類知識一般來自企業內部。
在流程工業控制系統的信息物理資產管理任務中,開放性知識包括某些常用物料的信息和通用物理化學反應機理等,通常可以在科學技術文檔或相關網站中找到。特異性數據包括人員信息過程反應設備的詳細信息(包括容器、塔器、反應釜、換熱器等)、控制設備的詳細信息(包括控制器、開關、起動器、接觸器、驅動器、電機、泵、網絡等)、信息流(包括生產目標和系統設定數據、實時運行和診斷數據、物料和能量需求數據、終端生產指標數據等)及其說明、過程機理說明、控制系統說明、控制系統操作手冊、各類算法和軟件的技術參考文檔等。上述信息來源中,既包含清單、列表和數據庫數據等結構化數據,也包含文檔、說明和手冊等非結構化數據。
2.2 本體構建
本體構建使用自頂向下和自底向上結合的方式。在自頂向下部分,由專家定義知識圖譜的模式層;這里使用七步法進行本體構建。在自底向上部分,從數據中提取本體。最后,所有本體都要經過專家的審核。
控制系統信息物理資產知識圖譜本體自頂向下的構建流程如圖3所示。
圖3???控制系統信息物理資產知識圖譜本體自頂向下的構建流程
首先確定本體的領域范圍。本知識圖譜的領域是流程工業控制系統的信息物理資產管理,目標是通過構建信息物理資產知識圖譜來提高控制系統資產庫的管理效率。
然后考慮復用已有的本體。這里考慮復用OntoCAPE 本體庫。它是針對化工過程工程構建的大規模本體,其中描述了一部分流程工業信息物理資產管理中涉及的概念,比如反應物質、反應裝置和工廠設備。OntoCAPE 中的“夾具(Fixture)”類及其常用子類如圖4所示,以工廠固定設備“Fixture”概念為例,給出了 OntoCAPE本體庫的一個簡單例子。然而從信息物理系統的角度來看,OntoCAPE 主要考慮了物理側的概念和屬性,對信息側討論較少。OntoCAPE 中未包含的概念和屬性需要單獨構建。
圖4???OntoCAPE中的“Fixture”類及其常用子類
最后列出控制系統信息物理資產管理的概念術語,定義類間的層次關系,定義類屬性,定義本體中的關系。控制系統信息物理資產知識圖譜的部分類的結構示意圖如圖5所示,其中概念共分為數據、算法、通信和算力四大類,每一大類又可以細分為若干子類。類屬性可以從機械和結構屬性、功能屬性、性能屬性、商業屬性、位置屬性5個方面考慮。類間關系可以從結構關系和功能關系兩個方面考慮。控制系統信息物理資產知識圖譜的部分類和關系示意圖如圖6所示。圖6中的“包含部分” “測量設備”“監控設備”“包含子類”“包含變量”和“隸屬機構”為結構關系;“上傳”“輸入”“輸出” “監控變量”“產生”和“負責人員”為功能關系。
圖5???控制系統信息物理資產知識圖譜的部分類的結構示意圖
圖6???控制系統信息物理資產知識圖譜的部分類和類關系示意圖
在自底向上的本體構建中,使用基于規則的方法從結構化和半結構化數據中提取概念和關系,進而構建本體。比如,為了避免不同數據中對化學物質名稱不一致引起的歧義,將 CAS 編號作為標準名來提取化學物質實體;類似地,使用設備統一編號作為參照來抽取反應裝置實體。對于非結構化數據,首先進行知識抽取,然后對抽取到的實體和關系進行專家人工審核,最后完成本體構建。
2.3 知識抽取
知識抽取分為兩個步驟。首先,從數據中抽取命名實體;然后,抽取命名實體的關系和屬性。正確的命名實體抽取是知識抽取的關鍵。對于結構化數據和半結構化數據,使用基于規則的方法進行抽取,比如“溫度傳感器”“熱敏電阻”“熱電偶”“電磁流量計”“霍爾傳感器”等詞匯都應當被識別為傳感器名,這種方法抽取速度快,準確率高。對于非結構化的文本數據,可以使用基于深度學習的方法進行命名實體識別。具體來說,首先對文本數據進行句子分割和字符分解,然后進行手動命名實體標注從而構建語料庫,最后使用語料庫中的帶標簽數據對深度學習模型進行訓練。在模型選擇上,LSTM網絡和CRF結合的方法和預訓練BERT(bidirectional encoder representations from transformer)+CRF都是有效的深度學習模型。抽取命名實體關系時,對于結構化數據和半結構化數據,可以使用專家編寫的模板進行關系抽取。對于非結構化的文本數據,同樣使用利用文本數據構建的語料庫進行深度學習模型的抽取。在模型的選擇上,將雙向長短期記憶神經網絡和注意力機制結合的模型表現出了良好的效果。
2.4 實體消歧和質量評估
信息物理知識圖譜中的歧義一方面來自自底向上構建時造成的多指和共指,另一方面來自自頂向下構建時的專家經驗的主觀性或疏忽。相比于開放域知識圖譜,本任務中圖譜構建有較多的專家參與,在構建時就考慮了其在流程工業控制系統中的適用性,因此結構性較好。因此,基于社會化網絡的實體消歧方法是一種行之有效的方法。
在質量評估中,可以采用從業者眾包校驗的方法。具體來說,將知識圖譜按照生產工藝流程或者控制功能層次分解,讓相關從業人員根據經驗對圖譜質量進行判斷。對于錯誤或置信度較低的知識,由工藝專家和知識工程師進行進一步的判斷。
2.5 知識存儲
常用的知識圖譜存儲方式包括以 Jena 和3store為代表的RDF表數據庫和以Neo4j為代表的圖數據庫。這里展示田納西-伊斯曼(Tennessee Eastman,TE)化工過程控制系統信息物理資產知識圖譜的一部分,如圖7 所示,其中明黃色節點代表操縱變量,粉紅色節點代表測量變量,灰黃色節點代表反應裝置,綠色節點代表傳感器,紫色節點代表算法,其包含操縱變量、測量變量、反應裝置、傳感器、監控算法5類實體共71個節點,152條邊,308個節點屬性和177個邊屬性。該知識圖譜存儲于 Neo4j 圖數據庫。TE 化工工過程控制系統信息物理資產知識圖譜的部分類屬性見表1。
圖7???Tennessee Eastman化工過程控制系統信息物理資產知識圖譜部分示意圖
3 未來研究展望
知識圖譜能夠有效地處理控制系統中涉及的多源異構數據,集成控制系統的認知和經驗知識。它有望在以下幾個方向發揮重要的作用。
3.1 信息物理資產管理
現代工業控制系統是集成了物理對象和信息資源的信息物理系統,涉及物質輸入輸出、物理化學反應、生產裝置、測量設備、控制設備、計算設備、存儲設備、通信設備、數據、算法、算力、通信和軟件資源。將這些資源信息都納入知識圖譜表達形式,有助于對控制系統信息物理資產進行高效管理。比如,知識圖譜可以方便地以圖的形式直觀地展示資源實體和資源實體間的關系;借助圖搜索算法,可以對資源依照關聯關系進行復雜的搜索;借助圖推理算法,可以發掘資源之間的隱藏關聯關系。在這方面,Zhou X C等人探索了化工生產領域的代理服務管理的知識圖譜構建。Farazi F等人將燃燒化學機理模型集成到知識圖譜中。
3.2 虛擬制造
數字孿生和虛擬制造是流程工業邁向智能化的重要技術。現代流程工業控制系統在功能上具有分層結構,包含了信息物理方面的諸多要素。知識圖譜是關系型數據的有力描述形式,能為不同功能層次之間提供信息對接平臺,對關鍵生產要素及其關系進行集成,從而為虛擬制造提供支撐。在這方面,基于知識圖譜的J-Park Simulator仿真平臺是具有代表性的工作成果,已經被用于石化生產過程的仿真和優化。
3.3 運行風險分析
控制系統的運行風險常由專家根據經驗推理判斷,利用專家經驗和從數據中提取的知識構建運行風險知識圖譜,有助于對風險事件進行自動分析和及時處置。比如,利用控制系統運行所積累的歷史風險數據,提取相關裝置、涉及物質、故障發生時的操作條件、故障原因、故障類型癥狀、處置策略等信息,再結合專家制定的風險分析規則,從而構建運行風險知識圖譜。當風險因素出現時,借助圖檢索算法,可以實現快速的風險因素的嚴重性分析、原因追溯和處置方案制定。此外,借助知識推理算法,還可以從已有運行風險知識中挖掘未被發現的風險因果關系。在這方面,參考文獻針對延遲焦化生產過程構建了安全知識圖譜用于風險分析;參考文獻針對化工生產中的危化品事故風險構建了危化品管理知識圖譜。
3.4 關鍵指標預測
工業控制系統常常機理復雜,無法得到精確的數學模型。利用工藝專家、控制專家和一線技術人員的關于系統機理的經驗,構建過程機理知識圖譜,可以為關鍵生產指標的準確預測提供支持。比如,將專家和技術人員關于變量之間影響強弱和時延關系的經驗存儲在知識圖譜當中,然后借助圖神經網絡等方法構建關鍵指標預測模型。這樣充分利用了專家經驗,有望提升關鍵生產指標的預測精度。在這方面,Wu D Y等人在將圖譜結構與預測模型結合方面做出了探索性的工作。
3.5 控制算法自適應調整
現代工業控制系統一般變量數目多,被控對象復雜。為了滿足不同回路和層級的任務要求,達到不同回路和層級的控制目的,控制系統中常用到PID、模型預測控制和自適應控制多種控制方法,控制方法及其參數的選擇往往依賴專家經驗。將專家的控制算法設計經驗(包括各個控制算法的適用條件、算法流程、基本參數及其選定依據等)保存到知識圖譜中,有助于實現控制算法的自適應調整。比如,將專家關于PID控制器主要參數的調節規則保存到知識圖譜中,當系統監視器返回異常結果時,知識圖譜使用圖檢索推薦最適宜的算法參數,或者推薦合適的備選控制算法。
4 結束語
知識圖譜使用圖的數據結構,結合圖論方法和自然語言處理技術,既能夠組織和表達控制專家積累的經驗,也能夠處理和挖掘控制系統中多源異構數據中的知識。在工業智能化發展方興未艾的今天,知識圖譜是推動控制系統智能化發展不可或缺的基礎資源,引起了研究者廣泛的關注。本文首先對現有的控制系統知識圖譜構建工作進行了回顧和總結,簡要介紹了領域知識圖譜的構建方法。然后,本文分析了控制系統的結構和特點,提出了控制系統知識圖譜的構建原則和構建流程,并以控制系統信息物理資產知識圖譜為例進行了比較詳細的說明。最后,本文給出了控制系統知識圖譜可能產生的重要影響的研究方向。
知識圖譜仍是一門新技術,其在控制系統中的應用也處于發展初期。本文希望能拋磚引玉,吸引更多研究者投入控制系統的知識圖譜的研究中。
作者簡介
牟天昊(1998?),男,上海交通大學電子信息與電氣工程學院博士生,主要研究方向為知識圖譜、機器學習以及它們在流程工業中的應用 。
李少遠(1965?),男,博士,上海交通大學電子信息與電氣工程學院講席教授,國家杰出青年科學基金獲得者,科技創新2030—“新一代人工智能”重大項目負責人。主要研究方向為預測控制、工業智能、滿意優化控制、分布式優化等 。
聯系我們:
Tel:010-81055448
? ? ? ?010-81055490
? ? ? ?010-81055534
E-mail:bdr@bjxintong.com.cn?
http://www.infocomm-journal.com/bdr
http://www.j-bigdataresearch.com.cn/
轉載、合作:010-81055307
大數據期刊
《大數據(Big Data Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的期刊,已成功入選中國科技核心期刊、中國計算機學會會刊、中國計算機學會推薦中文科技期刊,以及信息通信領域高質量科技期刊分級目錄、計算領域高質量科技期刊分級目錄,并多次被評為國家哲學社會科學文獻中心學術期刊數據庫“綜合性人文社會科學”學科最受歡迎期刊。
關注《大數據》期刊微信公眾號,獲取更多內容
總結
以上是生活随笔為你收集整理的虚拟专题:知识图谱 | 流程工业控制系统的知识图谱构建的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: npm ERR! cb.apply is
- 下一篇: git clone -b master