论文笔记:HKMF-T: Recover From Blackouts in TaggedTime Series With Hankel Matrix Factorization
論文筆記:Hankel Matrix Factorization for Tagged Time Series to Recover Missing Values during Blackouts_UQI-LIUWJ的博客-CSDN博客
的后續,故而大致部分和那篇類似,本文只設計/補充一些本論文的部分,可結合上篇一起觀看
TKDE 2021
0 前言
????????這篇論文是之前在 ICDE’19 上發表的工作 的擴展。 這與以前的工作之間的主要區別包括:1)我們方程化了約束和假設;
2)我們解決了將 HKMF-T 應用于高維數據的問題
3)通過對數據集進行下采樣,在不顯著影響其有效性的情況下提高了算法的效率;
4)對參數對系統性能的影響進行了基準測試
1 trend & tagged information
????????如果我們用10天的滑動平均?,可以看到MA(10)提供了一個很是平滑的trend。
????????與此同時,我們也可以發現,這里的tag信息(天氣情況),對自行車結果有著很深的影響:晴天和下雪天,自行車的數量分別比之前多&比之前少
? ? ? ? ——>實際的時間序列通常由一個內部的光滑trend,以及外部環境的影響組成
? ? ? ? 用符號表示,比如我們時間序列為,標簽序列為
? ? ? ? 于是我們有 x=s+e,其中s和e分別表示光滑趨勢,以及外部影響部分
2 損失函數正則項
2.1 時間正則項
在論文筆記:Hankel Matrix Factorization for Tagged Time Series to Recover Missing Values during Blackouts_UQI-LIUWJ的博客-CSDN博客
?中,我們知道正則項是
?我們可以用另一種形式表示
?其中L1為
的結果就是
2.2 tag正則項
這個在上篇論文中說的不多,這里則更詳細
?
我們希望同一個標簽下各個時刻的e值,和這個標簽的e值的平均值差距不要太大.同一個標簽下的e值之差為:
?
這里I是單位矩陣
表示了某一時刻屬于哪些tag的指示矩陣 ()
?是一個對角矩陣,其中,Cm是第m個tag的數量
?
?
?3 傳統MF在blackouts 問題中的局限性
?????????在blackouts問題中,時刻t的所有點的數據全部丟失,在這種情況下,時刻t的時間特征向量無法通過最小化學習 ,因為這一列的值全沒有
????????此外,包括 TRMF 在內的傳統基于 MF 的方法不包括有關外部事件或條件如何影響序列中的值的知識,這在分析現實世界數據序列中被證明是重要的
?
4 將HKMF-T問題應用到多維數據中
原理很簡單,就是疊加漢克爾矩陣
?
?5 實驗部分
數據集,baseline和前作一樣
評價標準相比于之間的RMSE,多了一項DTW distance
DTW 筆記: Dynamic Time Warping 動態時間規整 (&DTW的python實現)_UQI-LIUWJ的博客-CSDN博客
?同時多了一些實驗(單變量時間序列),
比如正則項參數的影響:
?p值的影響(p——漢克爾矩陣的列維度)
?trend 矩陣R的維度 (結論是幾乎沒有影響)
?
?5.1 多維時間序列的實驗
????????在本節中,我們展示了使用 MVCD 數據集將 HKMF-T 應用于高維數據序列的有效性。 我們將 62 個縣分為 10 個區域 ,以生成 10 維數據序列,每個區域的天氣狀況作為我們評估的標簽序列。 選擇這個數據集是因為它自然地將數據分成空間連接的區域,每個區域對應一個維度
5.1.1 和baseline的比較
????????在這個實驗中,我們將所提出的方法的性能與 DynaMMo 進行比較,因為后者也能夠捕獲空間相關性和處理blackouts。
????????此外,我們通過在兩種設置下進行實驗,比較了 HKMF-T 和 DynaMMo 在捕獲不同維度之間的空間相關性方面的能力:
1)具有相關性:算法以整個 10 維數據和標簽序列作為輸入;
2)無相關性:算法每次執行一維。
比較是在blackouts持續時間為 的情況下進行的,以評估算法的性能。 總體結果總結在表 2 中,詳細討論如下。
?
????????捕獲空間相關性。從表2可以看出,兩種算法都能有效地捕捉到不同維度之間的空間相關性,因為帶有空間相關性的HKMF-T和DynaMMo的性能都超過了沒有考慮空間相關性的對應算法。
????????HKMF-T與DynaMMo相比。通過比較HKMF-T和DynaMMo在空間相關性方面的表現,可以看出,當停電時間較短時,即lb=4時,DynaMMo有一定的優勢。然而,隨著停電規模的擴大,HKMF-T開始顯示出它的優勢。
總結
以上是生活随笔為你收集整理的论文笔记:HKMF-T: Recover From Blackouts in TaggedTime Series With Hankel Matrix Factorization的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文笔记:Hankel Matrix F
- 下一篇: 论文笔记:Matrix Completi