时间序列 预处理 python_【Python算法】时间序列预处理
【Python算法】時間序列預處理
1.時間序列的預處理 拿到一個觀察值序列后,首先要對它的純隨機性和平穩性進行檢驗,這兩個重要的檢驗被稱為序列的預處理。根據檢驗結果可以將序列分為不同的類型,對不同類型的序列會采取不同的分析方法。 對于純隨機序列(又稱為白噪聲序列),序列的各項之間沒有任何相關關系,序列在進行完全無序的隨機波動,可以終止對該序列的分析。白噪聲序列是沒有信息可提取的平穩序列?! τ谄椒€非白噪聲序列,它的均值和方差是常數,現已有一套非常成熟的平穩序列的建模方法。通常是建立一個線性模型來擬合該序列的發展,借此提取該序列的有用信息。ARMA 模型是最常用的平穩序列擬合模型?! τ诜瞧椒€序列,由于它的均值和方差不穩定,處理方法一般是將其轉變為平穩序列,這樣就可以應用有關平穩時間序列的分析方法,如建立ARMA模型來進行相應的研究。如果一個時間序列經差分運算后具有平穩性,則該序列為差分平穩序列,可以使用ARIMA模型進行分析。
2.平穩性檢驗
2.平穩性的檢驗 對序列的平穩性的檢驗有兩種檢驗方法: 一種是根據時序圖和自相關圖的特征做出判斷的圖檢驗,該方法操作簡單、應用廣泛,缺點是帶有主觀性; 另一種是構造檢驗統計量進行檢驗的方法,目前最常用的方法是單位根檢驗。
① 時序圖檢驗 根據平穩時間序列的均值和方差都為常數的性質,平穩序列的時序圖顯示該序列值始終在一個常數附近隨機波動,而且被動的范圍有界;如果有明顯的趨勢性或者周期性,那它通常不是平穩序列。
② 自相關圖檢驗 平穩序列具有短期相關性,這個性質表明對平穩序列而言通常只有近期的序列值對現時值的影響比較明顯,間隔越遠的過去值對現時值的影響越小。隨著延遲期數k的增加,平穩序列的自相關系數pk(延遲 k 期)會比較快的衰減趨向于零,并在零附近隨機波動,而非平穩序列的自相關系數衰減的速度比較慢,這就是利用自相關圖進行平穩性檢驗的標準。
③ 單位根檢驗單位根檢驗是指檢驗序列中是否存在單位根,如果存在單位根就是非平穩時間序列。
3.純隨機性檢驗 如果一個序列是純隨機序列,那么它的序列值之間應該沒有任何關系,即滿足y(k) = 0, k ≠ 0,這是一種理論上才會出現的理想狀態,實際上純隨機序列的樣本自相關系數不會絕對為零,但是很接近零,并在零附近隨機波動。 純隨機性檢驗,一般是構造檢驗統計量來檢驗序列的純隨機性,常用的檢驗統計量有Q統計量、LB統計量,由樣本各延遲期數的自相關系數可以計算得到檢驗統計量,然后計算出對應的p值,如果p值顯著大于顯著性水平a,則表示該序列不能拒絕純隨機的原假設,可以停止對該序列的分析。
總結
以上是生活随笔為你收集整理的时间序列 预处理 python_【Python算法】时间序列预处理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 学院后勤报修系统php_如何有效提升医院
- 下一篇: springboot生成包含特定数字_面