在日本山区流域使用支持向量机和 bagging、boosting 和 stacking 集成机器学习框架改进滑坡评估--文献阅读
為了在基于過程的模型中準確表示邊坡穩定性,有必要包含大量涉及滑坡幾何形狀和內部結構的局部特征的特征。這包括但不限于斜坡的分層和不連續性、運動裂縫、裂片、陡坡、地壘/地塹結構、降雨、空氣和土壤溫度、土壤水分含量、許多點的地下水位、地表和深度但是,獲取所有這些必要信息很麻煩,因此,這些模型被稱為特定地點模型,因為它們主要關注單個滑坡或小區域。
然而,到目前為止,由于復雜的自然環境,使用的滑坡敏感性和劃定方法的預測準確性仍然是一項具有挑戰性的任務
機器學習 (ML) 算法展示了以高精度解決非線性現實世界問題的有前途和有效的方法
最近,ML 中的集成方法在各個領域引起了廣泛關注,特別是在計算地球科學中,因為它們可以從一組分類器中構建學習器,以在許多現實世界的任務中以顯著的準確度處理復雜和高維數據(Dietterich?2000?; 周2014)。由于以下原因,構建“適當”的集成是很有可能的:
(1)集成算法能夠平均投票并減少選擇不正確分類器的風險;
(2)通過從許多不同的初始點執行局部搜索構建的集成可能比任何單個分類器都可以提供對手頭目標函數的改進近似;
(3)他們能夠擴展目標函數的空間。然而,檢查 LSM 的多集成框架是有限的,并且它們的性能正在評估中
計算步驟和方法的工作流程如圖5所示,主要涉及三個步驟:
(1)使用事后航拍照片和現場再生準備滑坡清單;
(2) 研究多重共線性分析,估計滑坡誘發因素的等級,并通過應用多個集成機器學習 (ML) 模型(bagging、boosting 和 stacking)生成 LSM 圖;
(3) 比較和驗證每個模型的性能。以下流程圖詳細描述了整個過程
Flowchart of the methodology followed in this study本研究采用的方法流程圖
迄今為止,對于誘發因素的選擇尚無正常規律或普遍共識。坡度、坡向、巖性、平面曲率和排水密度是最廣泛使用的誘發因素,誘發因素應根據滑坡的觸發機制、滑坡類型、案例研究區域的特征、可用的數據集和使用的模型
。13個誘發因素,即高程(DEM)、坡度、坡向、平面曲率、剖面曲率、總曲率、排水密度、到排水管網的距離、河流功率指數(SPI)、地形位置指數(TPI)、土地利用、累積根據以往的文獻。高程、坡度、坡向、曲率、平面曲率、剖面曲率等形態參數是在ArcGIS 10.5軟件中從10 m的數字高程模型(DEM)中提取的。
?地形位置指數 (TPI) 因子,也稱為相對地形位置,是一種地形崎嶇度測量值和當地高程指數。。TPI指數對于識別景觀格局和邊界非常有用,與巖石類型、主導地貌過程、土壤特征、植被等相對應。將最終輸出的柵格分類為山脊、上坡、中坡、平坡、下坡, 和使用自然休息的山谷。
為了檢查水文相關因素的影響,考慮到排水管網的距離和排水密度。到排水管網的距離和排水密度分別通過 ArcGIS 10.5 軟件中的歐幾里得距離和線密度工具計算。
人們普遍認為,近坡面的積水會通過改變土壤材料的重量和重力勢能來影響山坡的強度。為了將這種可變性整合到滑坡模型中,提取了復合地形指數(CTI)作為潛在土壤濕度的替代物
多重共線性分析
方差膨脹因子 (VIF) 和容差 (TOL) ,如果 VIF 值大于 10 或公差值小于 0.1,則表明誘發因素存在多重共線性問題
使用集成 ML 方法的模型的整體準確性可以通過因子選擇來提高,因為數據集中的某些因子可能會產生噪聲,從而降低模型的整體預測能力。因此,有必要檢查和消除具有低或無效預測能力的誘發因素。
總結
以上是生活随笔為你收集整理的在日本山区流域使用支持向量机和 bagging、boosting 和 stacking 集成机器学习框架改进滑坡评估--文献阅读的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 慎重升级 博主吐槽iOS 16续航最差
- 下一篇: 第一次申请信用卡难吗