降雨预测方法
降雨預測方法
-
DBNPF (Deep Belief Network for Precipitation Forecast)
來源:張雷師兄論文:A deep-learning based precipitation forecasting
模型:
比較:RBF、SVM、ARIMA、ELM(extreme learning machine)、SAE(Sparse AutoEncoder)
數據集:
遵義市1956-2010
train data:1956-2000
test data:2000-2010
-
動態區域組合MLP
來源:賈旸旸師兄論文:Short-term Rainfall Forecasting Using Multi-layer Perceptron
模型:
PCA:13個物理因子進行降維,輸入到MLP中
貪婪算法決定MLP的結構,
該模型的初始數據包括五個高空因素和八個地表因素。
在氣象學中,通常用位勢高度代替實際高度,用等壓面代替水平高度,因此,氣象數據總是采用等壓面格式。例如,500hpa通常相當于5.5km的高度。降雨系統通常由500hpa的天氣系統控制。根據區域經驗,該模型選擇的五個海拔因子分別是500hpa高度下的實際高度(x1)、溫度(x2)、溫度露點差(x3)、風向(x4)和風速(x5)。風向和風速影響著降雨系統的運動方向和速度。溫度露點差與濕度直接相關。溫度露點差、溫度和實際高度值影響著降雨系統的內能。地表因子代表該地區的局部大氣條件。不同地區地表因子的差異導致降雨不同。該模型中所用的八個面因子包括總云量(X6)、地表風速(X7)、地面風向(X8)、地面氣壓(X9)、地表3小時壓力變化(X10)、地表溫度露點差(X11)、地表溫度(X12)和過去三小時的降雨。周圍區域(x13)。對于同一個預測區域,每個周邊區域都與該預測區域建立一個MLP。表1顯示了所有13個因素。這些因素是我們模型的初始輸入。
最小-最大規范化。最常用的數據規范化方法之一是最小-最大規范化。它可以在0和1之間標準化數據。由于不同因素的大小不同,有必要對數據進行預處理。對于要處理的序列,序列的最大值對應于1,最小值對應于0,其余值在0和1之間按比例轉換。
主成分分析。歸一化后,PCA用于減小輸入的維數。確定新因子個數的標準是99%,即所選因子的特征值之和占總特征值的99%以上。經計算,新因子的總信息可以代表原始數據的99%以上。此標準定義了保留的信息量,但沒有指定所需的因子數量。對于不同的預測區域,因子的數量可能不同,但不會超過初始輸入,即13。在大多數情況下,需要的因素數量在3到8之間。PCA處理后,所需的計算資源大大減少。
MLP的輸入是Z1-Z4四個參數,輸出是降雨量
step1:
step2:中心預測點與其他地區各有一個MLP,兩個地區的距離決定了周圍MLP的數量。周圍多個MLP模型一起決策,如果預測降雨的MLP超過1,取均值。
比較:
數據集:
2015-2017年海拔(500hPa)測繪數據和數值預報結果。
train data:2015-2016
test data:2016-2017
-
基于雷達回波圖像的短期降雨預測
來源:基于雷達回波圖像的短期降雨預測
模型:
卷積自編碼器的編碼模塊首先提取每幀輸入圖像特征,送入LSTM預報網絡;LSTM預報網絡的編碼模塊,對輸入信息提取時序特征,在此基礎上,由LSTM預測模塊產生關于未來時段回波圖像時序特征預測。
比較:
在MINIST數據集上對自編碼器的層數和LSTM層數預測效果進行對比
數據集:
石家莊地區 2010 -2017 年之間降雨天氣的雷達回波圖像 。
回波圖像每6分鐘采集一幀, 1個小時內得到 10 幀雷達回波圖像,構成一個時間序列。
-
常用方法
常用的基于觀測和預報場的統計評分:
偏差值,均方根誤差,POD指數,CSI指數,FAR指數,TS評分,ETS評分
xgboost特性:
-
- 允許用戶在交叉驗證時自定義誤差衡量方法,例如回歸中使用RMSE還是RMSLE,分類中使用AUC,分類錯誤率或是F1-score。
- 允許用戶先迭代1000次,查看此時模型的預測效果,然后繼續迭代1000次,最后模型等價于一次性迭代2000次。
- xgboost的模型和傳統的GBDT相比加入了對于模型復雜度的控制以及后期的剪枝處理,使得學習出來的模型更加不容易過擬合。
總結
- 上一篇: 超市计算机主管总结报告,超市电脑员工作总
- 下一篇: echarts+vue实现中国地图