使用优化的基于模糊规则的特征选择技术和基于树的集成方法进行山洪敏感性建模--文献阅读
文章連接
Flash flood susceptibility modeling using an optimized fuzzy rule based feature selection technique and tree based ensemble methods - ScienceDirecthttps://www.sciencedirect.com/science/article/pii/S0048969719309349?via%3Dihub#bb0310
解決問題
在洪水評估過程中,主要需要成功解決三個方面的問題。
首先,需要提供總體框架,在該框架內對洪水現象演變背后的機制形成合理的解釋;
其次,找到最佳變量集;
第三,估計它們的影響。
模型分類
????????經驗模型是基于數據和數學公式的面向觀察的模型。它們可以被認為是黑盒模型,例如基于人工神經網絡的模型,它們沒有充分考慮水文系統的特征和過程,然而這樣的模型生成具有高預測能力的模型
????????經驗模型主要基于定性或定量技術;前者依賴于專家知識,后者依賴于分析數據識別獨立的洪水相關變量和洪水之間的關系。層次分析法和模糊邏輯是洪水敏感性評估中常用的主要定性技術統計和概率方法,例如頻率定量 (FR) ,權重-證據(WOE)和邏輯回歸(LR)被廣泛用作定量方法????????
????????概念模型使用半經驗方程模型的參數不僅通過現場數據進行評估,還通過校準過程進行評估,概念模型簡單、易于實施,但需要大量的水文和氣象數據。
????????基于物理的模型,使用有限差分方程模擬水運動的水文過程,需要大量的水文和氣象數據進行校準以及評估描述集水區物理特征的參數
為什么要選定機器學習進行建模
????????由于流域的非線性和動態結構難以評估和建模,洪水現象涉及復雜的過程,因此非線性機器學習算法具有已被提議用于洪水建模
????????最近,已經引入了幾種基于結合各種基分類器的模型進行預測的混合和集成方法,作為洪水評估的替代工具。混合和集成方法能夠提高預測性能并以更穩健的方式處理復雜的高維問題
????????混合方法的特征示例是使用基于自適應網絡模糊推理系統 (ANFIS) 的模型以及進化和元啟發式優化算法,例如遺傳算法(GA) ,粒子群優化(PSO),基于生物地理學的優化(BBO),蝙蝠算法(BA),蟻群優化( ACO) 和螢火蟲算法 (FA)?
最優變量集
特征選擇方法(FSM)是最常用的方法。FSM 可以幫助排除與低預測能力無關的變量,從而降低模型的復雜性并生成更簡單的模型。一種常見的 FSM,稱為包裝器方法,是應用學習算法并評估算法在具有不同變量子集的數據集上的預測性能
該論文的新穎之處
????????本研究的新穎性以及與先前研究的主要區別在于洪水敏感性評估中的 FSM 是基于模糊規則的學習分類器和基于種群的進化算法的使用。新穎的 FSM 與洪水敏感性評估中使用的其他 FSM 方法不同,因為它可以提供更靈活的分類邊界并允許分類基于整套規則。
模糊無序規則歸納算法 (FURIA) 被用作屬性評估器 ,而為了縮小搜索解決方案的空間,還考慮使用強大且穩健的搜索技術,GA 被用作更合適的全局搜索方法
開發一種新的山洪敏感性建模方法
用遺傳算法優化模糊規則特征選擇技術
FURIA-GA 特征選擇技術產生了一個高度預測的變量子集。
基于樹的集合模型在山洪敏感性建模中表現良好。
與集成模型相比,基于 FURIA-GA 的集成模型具有更高的準確性
建模步驟
第一階段
涉及數據選擇和分類程序、山洪清單圖的構建和非洪水區的識別。
最終數據庫包含 654 個洪水點和 654 個非洪水點。
分析了12個洪水相關變量,即:海拔(8)、坡度(10)、坡向(9)、曲率(7)、地形濕度指數(TWI)(7)、河流功率指數(SPI)(7)、地形陰影(9)、河流密度(7)、降雨量(6)、歸一化植被指數(NDVI)(8)、土壤類型覆蓋度和巖性覆蓋層,每個與山洪相關的變量主要取決于專家知識和遵循山洪評估中類似研究提供的指導方針
海拔和坡度對洪水的發生有顯著影響,坡度越陡,水流越快,而平坦的低地更容易發生洪水。
坡向,因為它會影響一個地區的水文條件
曲率?顯著影響一個地區的地表徑流和入滲能力
TWI 和 SPI 是 DEM 的二次導數,可以被視為描述一個地區的水文環境的變量,因為高 TWI 值表示易受飽和地表影響的地區和可能產生地表溢流的地區,而 SPI 代表侵蝕方面的水流
Toposhade 對應于可能影響水流收斂的山坡的陰影和長度
流域的河流密度對洪水的范圍和強度有顯著影響,因為河網和河流周邊地區極易發生洪水事件
NDVI 是描述一個地區的植被特征的量度,這些特征會影響一個地區的地表徑流和入滲能力,植被較少的地區被認為更容易發生洪水關于 NDVI 變量的使用及其在非雨季的估計,我們承認有兩個原因。第一個原因與需要捕獲干燥環境中的植被覆蓋率有關,這可以作為有關受植被存在與否影響的下游水運動強度的信息來源。這可以確定最易受洪水影響的區域。第二個原因與避免雨季可能出現的云層影響有關
巖性覆蓋被認為是一個重要的山洪相關變量,因為它極大地影響了土地滲透率和地表徑流等水文和水文地質條件
第二階段
包括實施頻率定量法和洪水相關因素的歸一化程序、多重共線性分析以及訓練和驗證數據集的構建。
????????第一階段
????????????????使用頻率比法來產生權重系數,頻率定量法用于估計因變量和自變量之間的概率關系,并為每一類洪水相關變量分配權重系數值
????????第二階段
????????????????對洪水相關因素進行歸一化過程,
????????第三階段
????????????????執行多重共線性分析,
使用方差膨脹因子(VIF)和容差(TOL)指標估計山洪變量之間的相關性,VIF值大于10,值為TOL <0.1 表示嚴重的多重共線性
????????第四階段
????????????????構建訓練和驗證數據集。7:3
第三階段
涉及使用 FURIA 和GA實施新的特征選擇,估計山洪變量的相對重要性,
模糊無序規則歸納算法(FURIA)用于基于FURIA實現的準確性評估屬性子集,而遺傳算法(GA)用作搜索方法。
第四階段
包括實施三種集成方法,以及驗證和比較它們的結果.
總結
以上是生活随笔為你收集整理的使用优化的基于模糊规则的特征选择技术和基于树的集成方法进行山洪敏感性建模--文献阅读的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: LSGO软件技术团队爬山活动
- 下一篇: 华为新一代“小方表”Watch Fit2