的garch预测_随机森林预测
當涉及到預測數據(時間序列或其他類型的序列)時,人們會關注基本回歸、ARIMA、ARMA、GARCH,甚至Prophet,但不排除使用隨機森林來預測數據。
隨機森林通常被認為是一種分類技術,但回歸問題絕對是隨機森林可以處理的。
在本文中,我打算使用在網上找到的一個數據集,叫做溫莎市房屋銷售價格。出于寫作的目的,我將只使用價格(price)和批量(lotsize)列。注:在以后的文章中,我打算摒棄這些數據,并對隨機森林進行多元回歸。
為了開始,先讓我們導入項目開始所需的所有庫。和往常一樣,你可以在這里使用jupyter筆記本來運行這個分析。
現在來加載數據:
同樣,我們只使用數據集中的兩列—價格(price)和批量(lotsize)。讓我們把這些數據畫出來,直觀地看一看,用批量(lotsize)來預測價格(price)是否有意義。
從數據來看,使用批量來預測價格似乎是一個不錯的猜測。
現在,讓我們準備好數據集來訓練和測試數據。
在上面,我們把隨機森林回歸量設置為X和y,然后設置我們的訓練和測試數據。對于訓練數據,我們將取前400個數據點來進行隨機森林訓練,然后對最后146個數據點進行測試。
現在,讓我們運行隨機森林回歸模型。首先,我們需要從sklearn中導入Random Forest regression:
現在是時候讓我們來運行隨機森林回歸看看會得到什么。
讓我們可視化價格(price)和預測價格(predicted_price)。
對于批量(lotsize)預測價格(price)這個大膽的猜測來說,結果確實差強人意。從視覺上,它看起來相當不錯(盡管肯定有錯誤)。
讓我們看看基本級別的錯誤。首先,快速地畫出兩者之間的“區別”。
這里的錯誤相當大。我們來看一些值,比如R的平方(R-Squared )和均方誤差(Mean Squared Error)。首先,讓我們從sklearn導入適當的函數。
現在,讓我們來看看R的平方(R-Squared):
R-Squared是0.6976,也就是0.7。對于隨機猜測來說,結果不是很好,但也不是很糟糕。0.7(或70%)是為了告訴你,大約70%的“信號”變化是由用作預測器的變量解釋的。從全局來看,這還不錯。
我可以繼續進行其他錯誤的計算,但這篇文章的重點不是展示“準確性”,而是展示如何使用隨機森林進行預測的“過程”。
英文原文:https://pythondata.com/forecasting-with-random-forests/譯者:任宇は神様
總結
以上是生活随笔為你收集整理的的garch预测_随机森林预测的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mis dss gis_MIS中的决策支
- 下一篇: c ++查找字符串_C ++结构| 查找