预测和健康管理原则(PHM)
介紹
預測和健康管理原則(PHM)
完整的 PHM 套件包括五個模塊:數據采集、監控和異常檢測、故障診斷、預測、規劃和決策。通過適當的檢測、診斷和預測以及緩解措施,強大的 PHM 系統將允許對核電廠的退化進行早期預警,并可能排除由于故障和故障而導致的嚴重后果,同時有助于減輕不必要的維護活動的負擔。
在 PHM 中重點使用數據驅動的方法,而最新的數據驅動分析方法,主要以人工智能 (AI) 和機器學習 (ML) 為代表——增強了從穩健異常檢測到復雜系統的自動化控制和自主操作的應用。
PHM 系統流程
一些要點:
狀態監控(CM)描述了一套提供狀態估計和異常行為預警的活動,故障檢測過程試圖從檢測數據中識別初期故障。
狀態檢測的從傳感器收集的數據,不能直接使用,需要進行適當的數據處理。
大容量數據的多維性和數據屬性之間的冗余是 CM 和故障檢測面臨的挑戰。所以進行數據清洗理的一些過程:通常需要特征選擇——包括選擇高質量屬性、去除共線特征以及從原始數據集中選擇最優子集特征。選擇的目標是從完整的原始傳感器數據數組中找到一個變量子集,這些變量可以有效地描述輸入數據流,同時減少錯誤/噪聲或無關信息的影響(清洗后的可使用最佳數據)。
- 特征選擇方法
特征選擇方法可以分為三類:過濾器、包裝器(wrappers)和嵌入方法。
過濾器方法采用單變量統計測量的特征的內在屬性。一般來說,過濾方法使用變量排名技術作為變量選擇的主要標準。使用合適的排名標準對輸入變量進行評分,并應用閾值過濾掉不太相關的特征。一些變量相關性的各種定義和度量,如互信息、Fisher 分數、浮雕、可分離性和相關性等廣泛使用的指標都在過濾器方法的范疇內。
優點:速度和擴展到大型數據集的能力,計算量輕,不易過擬合。
缺點:所選子集可能不是最優的,因為可能會獲得冗余子集。此外,那些本身信息量較少但與其他特征結合時提供信息的基本特征可能會被錯誤地丟棄。
wrappers 使用預測器作為黑盒,將預測器性能作為目標函數來評估變量子集。他們使用學習算法搜索特征子集的空間,并為每個可以添加到特征子集或從特征子集中刪除的特征計算學習算法的估計準確度。此外,它們依賴于用于評估由搜索算法生成的候選解決方案(即特征子集)的分類算法,因此計算成本更高。包裝器方法通常比過濾器方法提供更準確的結果,但需要特別注意防止過度擬合,并且包裝器通常無法很好地適應大型數據集。選擇過程基于試圖適應給定數據集的特定學習算法。通常,它遵循貪婪搜索方法,根據評估標準評估所有可能的特征組合。例如,分支定界算法、遺傳算法、粒子群優化、自適應浮動搜索、遞歸特征消除、相似性度量都屬于包裝方法的范疇。
嵌入式方法在 ML 算法本身的構建中完成了特征選擇過程。此方法類別結合了過濾器和包裝器的質量。對最優特征子集的搜索嵌入到分類器構造中,可以看作是在特征子集和假設的組合空間中的搜索。嵌入式方法使用獨立的度量來確定給定基數的最佳子集,并使用學習算法在不同基數的最佳子集中選擇最佳子集。因此,它們特定于給定的學習算法,并且具有考慮特征與分類模型(如包裝器方法)的相互作用的優勢,同時計算量要小得多(如過濾器方法)。
正則化和基于樹的模型是一些使用嵌入式特征選擇的常用方法。分類器的權重也可以用來對特征進行排序以去除它們,并且可以通過對相應權重進行敏感性分析來選擇特征。一些方法如使用支持向量機 (SVM) 作為分類器,優化 SVM 方程并為每個特征分配權重。
- 異常檢測方法
物理模型:
當充分理解潛在的物理機制時,人們可以嘗試推導出基于第一原理的分析模型來描述預期的標稱或故障 SSC 行為。
基于物理的模型的優勢在于:首先,它們明確考慮了機械、材料和操作特性;其次,它們甚至可以在系統構建和運行之前進行開發和評估;第三,它們可用于理解廣泛的操作和物質條件下的行為。
但相對應的缺陷在于僅使用第一原理和數學函數來模擬復雜的非線性系統是具有挑戰性的、耗時的,而且通常是不可能的。此外,使用簡化(有時是不合理的)假設來彌補運行時性能或不完整的領域知識,不可避免地會削弱此類模型中的物理基礎。
因此數據驅動的方法已經顯示出表征系統操作和開發系統模型的潛力,因為它們在建模方面具有獨立性,并且僅依賴于系統數據。
基于多變量統計的異常檢測方法:
主成分分析(PCA) 和偏最小二乘法(PLS) 是兩種基本的多元統計技術,已經應用于檢測故障方面。一旦選擇了檢測方法,就需要一個用于識別故障的度量。【在基于 PCA 和 PLS 的方法中,Hotelling 的 t 平方統計量被廣泛用于檢測具有特定閾值的異常。預測誤差的平方和也稱為 Q 統計量,是表示主成分模型無法解釋的事件變化的另一個指標。】
計算基于 PCA 或 PLS 的方法的監控統計數據和閾值是在假設來自傳感器的數據是高斯分布和線性相關的并且該過程在單一靜止條件下運行的假設下進行的。在實踐中這些條件并不理想,因此一些其他的方法,以放松傳統基于統計的方法中的假設。
獨立分量分析(ICA):發現統計上獨立和非高斯分量,是故障檢測的可靠替代方法。高斯混合模型(GMM)是另一種常用的非高斯數據處理技術。基于 k 近鄰的模糊 SVM,以減少計算負擔并解決數據不平衡和異常值的問題。
- 故障診斷
在 PHM 的總體區域內,故障診斷在狀態監控過程中檢測到故障后開始。診斷進一步分為 故障隔離 和 故障識別,它試圖識別故障發生的設備或組件,以及確定故障的原因。從邏輯上講,故障診斷的這兩個子任務通常作為單一分析執行。該分析基于故障征兆,其主要采取可用特征或故障特征的形式,以感測數據和測量的形式獲得。
診斷問題的常見分類方案是建模方法,其中使用基于模型或數據驅動的方法來處理問題方法。然而,這并不是一個完全明確的區別,因為這兩種方法之間可能存在一些重疊,并且可以開發各種混合方法。一個特定的重疊領域是使用基于規則的專家系統進行故障診斷。這些專家系統依靠“if-then”規則來根據故障癥狀診斷系統的狀態。可以看出,“if-then”規則的開發可以通過基于模型或數據驅動的方法來完成。
基于模型的方法:
常見的基于模型的方法包括使用觀察器或統計過濾器、檢查工廠模型和傳感器輸出之間的奇偶性、生成殘差在頻域中,使用因果圖模型(例如有符號有向圖和故障樹),以及基于定性物理學的方法(例如定性模擬和定性過程理論)。這些方法的常見分類方案是將濾波、奇偶校驗和頻率方法歸為定量方法,而圖形模型和定性物理方法則視為定性方法。
基于規則的方法:
基于規則的方法通過觸發特定的“if-then”規則來確定與測量/檢測到的故障癥狀相關的后果。傳統上,規則庫是使用專家判斷和有關系統的先驗知識開發的。盡管基于工程知識的系統可能很有吸引力,但基于規則的經典系統中的問題可能包括規則庫增長到無法管理的規模以描述越來越多的場景,以及基于規則的系統在遇到 目前沒有規則情況時可能會失敗。并且在不能完全確定給定測量癥狀的情況下應該激活哪個規則時進行操作,這些癥狀不能簡單地分類為單一的定性類別,例如“低”或“高”。處理這種不確定性的最常用方法是使用基于模糊規則的系統。例如使用置信度或開發基于信念規則的專家系統。然而,基于模糊規則的故障診斷工具仍然是處理不確定性的最突出使用的方法。
模糊規則庫,及運行的一般模糊邏輯,通過確定“清晰”輸入屬于“模糊”定性狀態的隸屬程度并使用模糊狀態,充當輸入和輸出之間的非線性映射來確定給定輸入的結果。
數據驅動的方法:
數據驅動的方法通常依賴于大量的過程數據,通常是歷史數據,來開發模型和推理方法。傳統上歸類為數據驅動的方法包括人工神經網絡——判別方法(用于傳統神經網絡)、基于貝葉斯統計或利用貝葉斯網絡 (BN) 的模型——生成方法、SVM——判別和 PCA 生成(無監督)或判別(監督),以及使用這些方法的組合。
- 預測:
預測是 PHM 的主要任務之一,因為其結果直接用于支持維護實踐的主動決策。預測模塊通常被定義為在設備不再執行特定功能(即 RUL)之前預測剩余時間的過程(即預測設備部件的剩余使用壽命)。預測很大程度上取決于監測、檢測和診斷階段:這些階段的準確性都會影響 RUL 估計。需要開發一種通用的預測方法,該方法可以在給定與設備當前狀態相關的一組測量值的情況下準確預測未來的設備狀態。方法大致分為四類:基于物理的方法、基于知識的方法方法、數據驅動方法和混合方法。
基于物理的方法:
基于物理的預測方法試圖基于一個綜合數學模型(通常以一系列常微分方程或偏微分方程的形式)來描述不斷發展的 SSC 退化過程,該模型表示故障的基本物理并編碼第一性原理輸入-輸出關系。導出的數學模型與 CM 數據相結合,識別模型參數,然后用于預測 SSC 健康狀態的未來演變。例如常見的基于物理的方法示例是裂紋擴展模型,其中 Paris 定律(也稱為 Paris-Erdogan 方程)或 Forman 方程組 用于將疲勞裂紋的擴展速率與應力強度因子和疲勞循環次數聯系起來。其他一些例子包括軸承退化、渦輪蠕變演化、管道退化、電池壽命和齒輪箱故障的預測。
缺陷:1. 無法建模:當導致故障的潛在物理過程通常沒有被完全理解或無法明確建模時,必須進行簡化假設和估計以促進模型開發,從而引發對模型在現實世界工程系統中的適用性的懷疑。2. 物理方法特異性:其特定于組件的性質,基于物理的方法很難重新配置以適應替代領域,并且其中大多數僅適用于組件或子系統級別。3. 應用于系統級預測問題或需要表示多種故障模式時(核設施中典型的 SSC ),模型復雜性和相關的計算成本可能會變得難以進行在線分析和決策。
基于統計的方法:
基于統計的預測方法,也稱為經驗預測方法,是一種灰盒方法,將資產退化視為一個隨機過程,受不同來源的可變性和不確定性影響。在統計方法中,RUL 是一個隨機變量,其概率密度函數是根據經驗數據確定的。
基于統計的預測通常可以分為兩個子類別。①第一個子類別中的模型基于時間序列 CM 數據,這些數據直接描述了受監控 SSC 的潛在退化過程。基于回歸和馬爾可夫的模型都屬于這個子類別。在基于回歸的在模型中,時間序列數據的預測是通過使用自回歸移動平均過程實現的,該過程假設目標 SSC 的未來狀態線性依賴于過去的觀察和正態分布的隨機噪聲。這些模型易于實現,計算成本低,但其性能受歷史觀測趨勢信息的嚴重影響,在初期失效階段和長期預測中可能不可靠。在基于馬爾可夫的模型中,假設退化過程在滿足馬爾可夫(或無記憶)屬性的有限狀態空間內進行轉換,但此模型并沒有被大量采用,因為所有的健康狀態都需要直接觀察。此外,無記憶假設可能不適用于某些實際退化過程,并且通常需要大量數據或經驗知識來構建狀態轉移概率矩陣。②第二個子類別中的模型依賴于部分觀察到的狀態過程和間接的CM數據(即只能間接表明被監測SSC的潛在健康狀態的數據,例如振動數據)。基于貝葉斯定理的基于隨機過濾的方法屬于這一子類別*。基于 DBN、卡爾曼濾波器和粒子濾波器*是兩種最常見的過濾算法。卡爾曼濾波算法是為線性高斯問題設計的,并且已經提出了一些增強版本;粒子濾波算法是一種順序蒙特卡羅方法,在非線性、非高斯系統中是更好的選擇。由于它們能夠通過更新在線測量的概率狀態估計來表征退化過程的未來不確定性,這兩種過濾方法在機械 RUL 預測中都有很多應用。
基于知識的方法:
基于知識(也稱為基于經驗或基于規則)的預測方法完全建立在專家知識之上。這種方法不依賴于系統的物理模型。它們的實現相對簡單;但是,它們僅適用于存在專家知識以使用專家系統或模糊邏輯的算法族來模仿類人表示和推理的情況。
和上述用于故障診斷的專家系統類似,用于預測的專家系統旨在將來自專家的顯式知識轉化為人類編碼的“if-then”規則;基于模糊邏輯的預測方法可以處理專家知識固有的不確定性;基于相似性的預測是另一種基于知識的方法,消除了對領域專家定性知識建模的要求,盡管這種方法有時被歸類為數據驅動方法,但它實際上遵循基于規則的建模理念,即在受監控案例和先前已知故障庫之間進行相似性評估。
數據驅動的方法:
數據驅動的預后方法直接使用目標 SSC 的 CM 數據,不包含第一性原理信息或專家知識。他們依靠觀察到的數據中的趨勢來構建數學模型來估計被監測設備的未來狀態。
缺陷:1. 數據量大:使用數據驅動方法的預測模型通常需要覆蓋廣泛條件的大量數據,包括退化模型的運行到失敗數據。特定 SSC 的運行到故障數據的可用性;2. 數據質量:RUL 預測的性能和置信水平與用于推斷模型參數和確定故障閾值的可用數據的數量和質量有關;3. 參數限制:數據驅動的方法無法推斷超出訓練數據所跨越的領域。
一些機器學習的方法:
基于 ML 的預測方法嘗試使用 ML 或 DL 技術直接從可用觀察(或提取的特征)中學習退化模式并預測 RUL。在基于 ML 的方法中,不需要事先對分析的 SSC 進行物理理解。然而作為一種黑盒方法,由于缺乏透明度,結果難以解釋。除非執行額外的不確定性量化(通常使用貝葉斯推理方法),否則基于 ML 的方法通常提供 RUL 的點估計而不是概率處理。多種 ML 算法已用于預測,可大致分為 ANN、高斯過程回歸 (GPR) 和 SVM 的變體。
ANN是數據驅動的預測方法中最常見的建模技術,就像故障診斷一樣。一些ANN方法,如FFNN和循環神經網絡(RNN) 是最流行的。FFNN 是 ANN 的最簡單形式,主要用于學習健康指數和 RUL 之間的關系。RNN 是 FFNN 的后代,其特點是能夠顯式處理時間序列數據。標準 RNN 在學習長期時間依賴性時會遭受梯度消失和爆炸的困擾;門控循環單元 (GRU) 和 LSTM 網絡是 RNN 變體來解決這個問題。一般來說,GRU 的計算成本更低,更適合較小的數據集,而 LSTM 更適用于大型數據集。除了上述兩種常用的人工神經網絡之外,還有其他幾種變體——例如小波神經網絡、CNN 變體、生成對抗網絡 和強化學習等。
GPR模型基于高斯過程(具有聯合多元高斯分布的隨機變量的累積損傷過程)來預測未來的健康狀態。與人工神經網絡相比,這種方法適用于小型和大型數據集,盡管它在計算和存儲方面通常具有很高的復雜性。正如故障檢測(“狀態監測和故障檢測”部分)和診斷(“數據驅動方法”部分)模塊中所詳述的,SVM是基于支持向量核心概念的成熟的監督學習工具。不同的 SVM 變體已應用于機械 RUL 預測。
混合方法:
基于物理、基于知識和數據驅動的預測方法各有其優勢和局限性。雖然適當的方法選擇取決于對系統行為和可用數據的了解,但混合或融合方法試圖整合不同方法類型的優勢以改進 RUL 預測結果。此外,在現實世界中,沒有一種方法被認為足以解釋分析系統的所有可能故障和失效模式。混合方法可以由前述方法的任意組合組成。特別感興趣的是基于物理和 ML/DL 的技術的集合,其中故障物理知識和實驗數據都可以得到適當利用,通過這種方式,組合方法促進了對輸入-輸出關系的物理解釋,而不是黑盒處理,同時不需要像獨立對應物那樣準確的物理理解或大尺寸數據。另一個流行的方向是在貝葉斯框架下開發混合預測工具(例如,卡爾曼濾波器和粒子濾波器),因為它們具有魯棒性和在不確定性下推理的能力。該方向已成為多項研究的主題,并已應用于旋轉機械、電池和電解電容器等各種應用。
- 決策:
一旦基于 CM 數據和診斷/預后模型確定了受監控 SSC 的當前和假定的未來健康狀態,至關重要的是能夠在可能的(初期)故障/故障發生之前及時和正確地采取行動。進展為緊急情況。因此,決策被認為是整個 PHM 套件中不可或缺的模塊。在這種情況下,決策過程是指使用先前模塊的輸出——故障分析和故障概率 (POF) 診斷估計、RUL 預測來自預測——為 O&M 計劃和在多個模塊中選擇最佳維護操作提供信息為獲得最有利的運營績效而執行的替代選項。該過程可以由具有不同運營商決策支持級別的人工執行,或者最終通過啟用自主的技術來執行。如果實施得當,該模塊將在資產完整性管理以及規劃運維活動和人員配備水平方面發揮重要和有益的作用。
統計決策理論:
統計決策理論關注基于統計知識的決策,它揭示了決策問題中涉及的不確定性。經典統計領域旨在使用統計調查產生的樣本信息來推斷數據的使用;相反,統計決策理論試圖將樣本信息與問題的其他方面相結合,以做出最佳決策。除了樣本信息之外,通常還有兩種其他類型的信息是相關的。首先是對決策可能后果的了解。通常,這種知識可以通過確定每個可能的決定和各種可能的不確定性值所產生的損失來量化。第二種,先驗信息,通常來自過去對涉及類似不確定性的類似情況的經驗。尋求利用先驗信息的統計方法稱為貝葉斯分析。貝葉斯方法是最常被提及的數學方法之一,專門用于廣泛應用中的決策過程。
基于規則的決策:
基于規則的模型 1) 識別系統狀態,2) 將狀態與任務相關聯,以及 3) 訪問存儲的規則以執行任務。工廠操作程序(OP) 本質上是由人工操作員執行的基于規則的決策模塊。OP 是為正常運行而開發的,以確保工廠在運行限制和條件內運行,并為安全進行所有正常運行模式提供指導。對于異常情況和基于設計的事故,創建基于事件或基于癥狀的程序。使工廠程序系統自動化的一種方法是通過決策表來實施規則,決策表將條件與要執行的動作相關聯。
效用理論:
經濟學家發展了效用理論來解釋和預測人類在風險和不確定性下的決策。效用理論的基本假設是一個理性的決策者總是選擇使效用的期望值最大化的替代方案。建立在這個假設中的是一個進一步的假設,即人類決策者接受和使用理性代碼,從而可以構建允許預測人類行為的數學表示。效用理論可以作為用于實時自主控制的決策系統的基礎構建塊。給定一組看似可行的替代解決方案,可以比較為每個替代方案確定的實施風險,以找到風險最小的解決方案。與工廠 OP 或其他決策策略相關的獨立損失和增益函數可以表述為非線性關系。NPP 效用理論的示例性實施見提出了一種基于影響圖的咨詢模型來為工廠人員提供決策支持。
馬爾可夫決策過程:
對于隨機環境中的順序決策問題,最大預期效用的相同原則仍然適用,但最佳決策將需要對未來的行動和觀察序列進行推理。馬爾可夫決策過程(MDP) 提供了一個數學框架,用于在結果部分隨機且部分受決策者控制的情況下對決策進行建模。MDP 已成功用于廣泛的自動控制問題——尤其是自動駕駛,并且通常使用動態規劃 (DP) 解決優化問題以選擇正確的決定。部分可觀察的MDP(POMDP) 是 MDP 的概括,它對決策過程進行建模,其中假設 MDP 表示系統動態,但并非所有狀態都是可觀察的。相反,模型接收到的測量結果是不完整的,并且通常是嘈雜的預測。因此,模型必須在可能的狀態空間上估計后驗分布。POMDP 在信念空間上計算價值函數。信念是整個概率分布的函數。POMDP 的精確解會為狀態空間上的每個可能信念產生最優動作,從而最大化價值函數。然而,這個最大化過程需要一個遠非實用的迭代算法。對于任何合理數量的狀態、傳感器和執行器,價值函數的復雜性都令人望而卻步。針對該挑戰的一個推薦解決方案是使用差分 DP(一種基于 DP 的軌跡優化類最優控制算法),因為它僅在不受約束的控制空間上進行優化。
離散事件模型:
許多人工設備和系統以及一些自然系統僅顯示離散值或結果。這些類型的系統最好描述為離散事件系統(DES)。閥門的打開和關閉或泵啟動過程的開始是 NPP 中離散事件過程的示例。這些流程通常與 OP 相關聯,由工廠操作員處理他們的控制。DES 滿足以下特性:1)狀態空間是離散集;2)狀態轉換機制是事件驅動的。在這樣的系統中,時間不是一個合適的自變量,傳統的微分方程方法如現代控制理論不適用于它們。DES 通常由有限狀態自動機或Petri 網建模. 這些模型使用定義的狀態轉換結構來描述系統每個狀態中可能發生的事件,并且它們在表示狀態信息的方式上有所不同。
總結
完整的 PHM 套件利用傳感器技術來監控健康狀況、檢測異常、診斷故障、預測 RUL,并主動管理復雜工程系統(如 NPP)中的故障。一個完整的 PHM 系統分為五個模塊/步驟。
1)數據采集:從感興趣的 SSC 采集數據的過程對于準確、可靠地預測其健康狀況是必要的。收集的數據可以是感官數據或事件數據。傳感數據是通過目標設備上安裝的傳感器跟蹤的測量結果,是“數據采集:新興傳感器技術”部分的重點,介紹了一些已用于核應用或被認為很快對 CM inside 有用的新興傳感技術核電廠。
2)監測與檢測:持續監控從目標 SSC 收集的數據是否偏離正常行為,這是異常的指標。如“狀態監測和故障檢測”部分所述,故障檢測過程試圖識別初期故障和故障。傳感器收集的多維、大容量原始數據還不能直接使用,需要適當的特征選擇。“特征選擇方法”部分描述了三類特征選擇方法:過濾器、包裝器和嵌入方法。在“異常檢測方法”部分,重點介紹了使用數據驅動方法檢測異常的研究工作。特別是,基于多元統計的各種故障檢測方法受到了關注。
3)故障診斷:一旦檢測到異常,診斷故障至關重要,換句話說,將故障定位到結構的特定組件或區域(即故障隔離)并確定故障的根本原因故障(即故障識別)。如“故障診斷”部分所述,可以使用基于模型的方法(“基于模型的方法”部分)、基于規則的方法(“基于規則的方法”部分)或數據驅動的方法進行診斷。方法(“數據驅動方法”部分)。然而,這些區別并不完全清楚,可以開發各種混合方法。
4)預后:根據 SSC 將如何退化,然后應用適當的預測模型來估計其 RUL。被視為 PHM 最有益的方面之一,預測是矛盾的模塊,特別是在核工業中。沒有針對所有預測問題的普遍接受的方法,并且已經開發了各種算法以應用于特定情況或組件類別。“Prognostics”部分基于最近的評論論文集,將這些算法分為四個模型類別:基于物理的(“Physics-Based Methods”部分)、基于知識的(“Knowledge-Based Methods”部分)、數據驅動的(“數據驅動方法”部分)和混合(“混合方法”部分)模型。數據驅動的預測模型——從傳統的統計方法(“基于統計的預測”部分)到先進的 ML/DL 技術(“基于機器學習的預測”部分)——對大型復雜系統特別感興趣,并且它們已經機械預測領域的大多數研究課題。混合方法進一步整合了不同模型類型的優勢,以改進 RUL 預測結果。
5)決策:基于目標 SSC 當前和假定的未來健康狀態,通過對所提議的緩解行動的預測計算和風險評估的整合,為 O&M 規劃提供信息,以實現最佳(并最終自主)控制和決策。作為更廣泛的 PHM 哲學不可或缺的一步,自主決策模塊尚未在核領域得到廣泛研究。鑒于核電廠的現狀和明顯差距,“決策”部分首先總結了決策中使用的一般方法(“決策方法”部分)。
總結
以上是生活随笔為你收集整理的预测和健康管理原则(PHM)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习vad人声检测之标签制作
- 下一篇: 华硕主板 TUF B365M-PLUS