當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

的garch预测_随机森林预测

發布時間：2025/3/11 编程问答 19 豆豆

生活随笔收集整理的這篇文章主要介紹了的garch预测_随机森林预测小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

當涉及到預測數據(時間序列或其他類型的序列)時，人們會關注基本回歸、ARIMA、ARMA、GARCH，甚至Prophet，但不排除使用隨機森林來預測數據。

隨機森林通常被認為是一種分類技術，但回歸問題絕對是隨機森林可以處理的。

在本文中，我打算使用在網上找到的一個數據集，叫做溫莎市房屋銷售價格。出于寫作的目的，我將只使用價格(price)和批量(lotsize)列。注:在以后的文章中，我打算摒棄這些數據，并對隨機森林進行多元回歸。

為了開始，先讓我們導入項目開始所需的所有庫。和往常一樣，你可以在這里使用jupyter筆記本來運行這個分析。

現在來加載數據:

同樣，我們只使用數據集中的兩列—價格(price)和批量(lotsize)。讓我們把這些數據畫出來，直觀地看一看，用批量(lotsize)來預測價格(price)是否有意義。

從數據來看，使用批量來預測價格似乎是一個不錯的猜測。

現在，讓我們準備好數據集來訓練和測試數據。

在上面，我們把隨機森林回歸量設置為X和y，然后設置我們的訓練和測試數據。對于訓練數據，我們將取前400個數據點來進行隨機森林訓練，然后對最后146個數據點進行測試。

現在，讓我們運行隨機森林回歸模型。首先，我們需要從sklearn中導入Random Forest regression:

現在是時候讓我們來運行隨機森林回歸看看會得到什么。

讓我們可視化價格(price)和預測價格(predicted_price)。

對于批量(lotsize)預測價格(price)這個大膽的猜測來說，結果確實差強人意。從視覺上，它看起來相當不錯(盡管肯定有錯誤)。

讓我們看看基本級別的錯誤。首先，快速地畫出兩者之間的“區別”。

這里的錯誤相當大。我們來看一些值，比如R的平方(R-Squared )和均方誤差(Mean Squared Error)。首先，讓我們從sklearn導入適當的函數。

現在，讓我們來看看R的平方(R-Squared):

R-Squared是0.6976，也就是0.7。對于隨機猜測來說，結果不是很好，但也不是很糟糕。0.7(或70%)是為了告訴你，大約70%的“信號”變化是由用作預測器的變量解釋的。從全局來看，這還不錯。

我可以繼續進行其他錯誤的計算，但這篇文章的重點不是展示“準確性”，而是展示如何使用隨機森林進行預測的“過程”。

英文原文：https://pythondata.com/forecasting-with-random-forests/
譯者：任宇は神様

以上是生活随笔為你收集整理的的garch预测_随机森林预测的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。