MVGCN 人群流量预测模型 笔记
Predicting Citywide Crowd Flows in Irregular Regions Using Multi-View Graph convolutional Networks 筆記
作者:Junkai Sun, Junbo Zhang, Qiaofei Li, Xiuwen Yi, Yu Zheng
來源:arXiv:1903.07789v2 [cs.CV] 17 Jul 2020
1 論文背景與動機
? ? ? ?先前的工作主要集中在預(yù)測規(guī)則的網(wǎng)格化區(qū)域的人群流動。然而,城市實際上被道路網(wǎng)絡(luò)隔開,非常不規(guī)則。預(yù)測城市不規(guī)則區(qū)域的人群流動,對于交通控制、風險評估和公共安全意義重大。
? ? ? 人群流量預(yù)測問題是一個時空圖(STG)預(yù)測問題,不規(guī)則區(qū)域為圖節(jié)點,區(qū)域間過渡流用來構(gòu)造邊。但由于不同區(qū)域之間的相互作用和空間相關(guān)性,不規(guī)則區(qū)域人群流量預(yù)測比較困難,受到許多因素影響:
? ? ? 1)STG不同頂點之間的相互作用和空間相關(guān)性。
? ? ? 2)不同時間間隔之間的多重時間相關(guān)性:鄰近性、周期性、趨勢;
? ? ? 3)復(fù)雜的外部因素(天氣、事件)和元特征(一天的時間,周末/工作日)
? ? ? ?本文提出利用空間圖卷積建立一個多視角圖卷積網(wǎng)絡(luò)(MVGCN),用于人群流量預(yù)測問題,其中不同視角能捕捉到上述不同的因素。本文使用四個數(shù)據(jù)集來評估MVGCN,結(jié)果表明,MVGCN方法優(yōu)于最先進的方法。
2論文創(chuàng)新
2.1提出一種GCN變體,它可以捕捉不同節(jié)點之間的空間相關(guān)性。設(shè)計多視圖融合模塊,將不同視圖的多個潛在表示融合在一起。多視圖融合有效地利用不同視圖基于其特性的輸出。
2.2 提出了一個綜合框架,包括數(shù)據(jù)預(yù)處理、地圖分割和地圖聚類、過渡流構(gòu)建圖、GCN預(yù)測人群流量。
3論文模型
?該框架由數(shù)據(jù)準備和模型學習兩個階段組成:
? ? 人群流量預(yù)測問題——STG預(yù)測問題:
? ? 節(jié)點——不規(guī)則區(qū)域;邊——流出和區(qū)域之間的過渡流。
?
? ? ?Inflow-- 給定時間間隔內(nèi)其他區(qū)域進入某區(qū)域的人群的總流量;
? ? ?Outflow--給定時間內(nèi)離開某區(qū)域到其他區(qū)域的人群的總流量。
?
? ? ? 通過在道路上行駛的汽車/自行車的數(shù)量、行人的數(shù)量、在公共交通系統(tǒng)上行駛的人數(shù)來衡量人群的流量。利用車輛的GPS軌跡來測量交通流量。
?map segmentation:
? ? ?1)利用形態(tài)學圖像處理技術(shù)來處理區(qū)域劃分任務(wù),即將地圖劃分為2400個×2400個小網(wǎng)格單元,并將每個路點映射到其對應(yīng)點網(wǎng)格單元,從而獲得二值圖像,1和0分別代表路段和空白區(qū)域。
? ? ?2)應(yīng)用dilation和thinning得到路網(wǎng)骨架。
? ? ?3)使用連接分量標記算法(CCL)獲得所有標記的不規(guī)則區(qū)域的位置,該算法通過聚類“1”標記的網(wǎng)格找到單個區(qū)域。
Map clustering:
? ? ? ?把兩個低層區(qū)域之間的邊緣權(quán)重定義為一個時段內(nèi)的平均人群流量之間的Spearman's?rankcorrelation?coefficient。 小區(qū)域被聚集成一些高級別區(qū)域
Graph Construction——使用歷史區(qū)域過渡流的拓撲圖。
? ? ? 從流量數(shù)據(jù)中選擇一段時間,比如一到兩個月。 然后,可以統(tǒng)計成對區(qū)域之間的有效時間切片。有效時間片是指考慮軌跡數(shù)據(jù)的噪聲,當區(qū)域過渡流>α 當區(qū)域過渡的有效時間切片比大于閾值β時,PLA一個二進制值無向邊來連接它們。α=3,β=0.1。
? ? ? 每個頂點vi∈V都有一個地理空間位置pi和時變屬性。這些屬性在時間t上可以看作是圖信號Xt∈RN×C,其中Xt[i,:]∈RC表示節(jié)點vi的C個屬性,例如流入和流出(C=2)。 兩個區(qū)域之間的邊緣是由區(qū)域過渡流構(gòu)造的。 兩個區(qū)域之間的邊緣是由區(qū)域向過渡流構(gòu)造的,A中的二進制入口值表示兩個區(qū)域在交通流中是否相關(guān)。
? ? ? 模型輸入:原始軌跡和道路網(wǎng)絡(luò)。
? ? ? 模型輸出:城市的不規(guī)則區(qū)域的人群流入和流出(inflows/outflows)。
4 算法步驟
4.1 給定一個鄰接矩陣A,根據(jù)空間距離為現(xiàn)有邊分配空間權(quán)值。考慮了在STG中頂點的地理空間位置。 S∈RN×N是修正的鄰接矩陣,;
4.2 ?ω∈RN×N是通過閾值高斯核加權(quán)函數(shù)計算的空間加權(quán)鄰接矩陣。 dist(pi,pj)是指節(jié)點vi和vj之間的地理距離;θ和κ是控制鄰接矩陣的尺度和稀疏性的兩個參數(shù)。
4.3 ?stack M spatial graph convolutional layers? 卷積整合了地理空間信息
4.4 ?為捕捉M-hop空間相關(guān)性和相互作用,疊加了M空間圖卷積層。 當M很大時,我們需要一個非常深的網(wǎng)絡(luò)。 殘差學習允許神經(jīng)網(wǎng)絡(luò)具有100層的超深結(jié)構(gòu)。通過疊加多個基于GCN的殘差單元,可以構(gòu)建非常深的神經(jīng)網(wǎng)絡(luò)來捕獲多跳空間依賴
4.5?提出一種多視圖融合方法,將許多流視圖的潛在表示與兩個全局視圖(外部和元數(shù)據(jù))融合。 不同的區(qū)域具有不同的時間性質(zhì)。采用基于參數(shù)矩陣的融合方法將五個GCN的輸出融合為時間視圖。 W1—W5分別調(diào)節(jié)受臨近、日周期、周周期、月趨勢和季度趨勢影響的程度。
?
4.6 ?Iext和元數(shù)據(jù)Imeta分別將喂入不同的FC層中,以獲得不同的潛在表示?ext和?meta。 只需連接嵌入模塊的所有輸出,通過整形添加FC層,獲得Ocon∈RN×C。
4.7不同的因素可能以不同的方式改變流動。利用兩種不同的融合方法:對于逐步變化,采用求和融合方法,?對于突然的變化,用基于門控機制的融合,其中σ是一個近似的門控函數(shù)。當Ocon的級聯(lián)表示捕獲一些特殊的外部信息,如暴雨天氣時, 由于sigmoid 函數(shù)性質(zhì),將突然增加,相比Ocon成為一個更大的值。而在大多數(shù)常見的情況下,它應(yīng)該接近于零,沒有突然的變化。基于兩種融合方法,最終輸出計算為
4.8 胡伯損失是和折衷, δ為閾值(默認值為1).Huber損失結(jié)合了零附近平方誤差損失和絕對誤差損失理想性質(zhì)。
5 論文實驗
5.1 數(shù)據(jù)集
1)TaxiNYC:2011年1月1日—2016年6月30日紐約市的出租車GPS數(shù)據(jù)。 將NYC劃分為100個不規(guī)則區(qū)域,據(jù)過渡流和區(qū)域間的地理距離建立圖,計算人群流量。
2)TaxiBJ:北京出租車GPS數(shù)據(jù),四個時間間隔:2013年7月1日—2013年10月30日,2014年3月1日—2014年6月30日,2015年3月1日—2015年6月30日,2015年11月1日—2016年4月10日。構(gòu)圖和人群流量計算方法與TaxiNYC相同。
3)BikeDC:取自華盛頓特區(qū)自行車系統(tǒng)。行程數(shù)據(jù)包括:行程持續(xù)時間,起止站ID,起止時間。共有472個站點。對于每個車站,兩種流量,流入是進入自行車的數(shù)量,流出是簽出自行車的數(shù)量。120個不規(guī)則區(qū)域。構(gòu)造了這些區(qū)域之間具有過渡流和地理距離的圖。
4)BikeNYC:取自紐約自行車系統(tǒng),2013年7月1日—2016年12月31日軌跡數(shù)據(jù)。共有416個車站。 刪除了不可用的自行車站點,并將其余的站點集中到120個區(qū)域。紐約市的圖形構(gòu)造和自行車流量計算方法與BikeDC相同。
?
上述四個數(shù)據(jù)集:測試集——最后四周的數(shù)據(jù);訓練集——所有剩余數(shù)據(jù)。
? ? ?本文過站點或區(qū)域之間的地理距離建立通勤網(wǎng)絡(luò)(即圖),站點或區(qū)域可以看作是圖中的節(jié)點。 每個站點都有地理空間位置。 對每個區(qū)域,近似地使用區(qū)域中心位置的地理空間位置。
5.2 對比方法
time-series models:?? ?1)HA: Historical average??? ?2)VAR: Vector auto-regressive
use the spatial and temporal features? 3)GBRT: Gradient boosting decision tree
neural networks:
? ? ? ?4)FC-LSTM: Encoder-decoder framework using LSTM
? ? ? ?5)GCN: ?3-layer supervised graph convolutional network
? ? ? ?6)DCRNN: ?2-layer supervised diffusion convolutional recurrent neural network
? ? ? ?7)ST-MGCN: Forecasting ride-hailing demand with spatiotemporal multi-graph convolution network.
based on Gaussian?Markov random fields:
? ? ? ?8) FCCF: Forecasting Citywide Crowd Flow model based on Gaussian Markov random fields
? ? ? ?9)FCCFno Trans
? ? ? ? 說明:1)利用TensorFlow實現(xiàn)基于神經(jīng)網(wǎng)絡(luò)的模型,并通過反向傳播和Adam[17]優(yōu)化進行訓練。? 2)MVGCN模型以及大多數(shù)對比方法都用TensorFlow實現(xiàn),模型訓練過程在兩個具有64GB RAM和16GB GPU內(nèi)存的TeslaV100GPU上執(zhí)行。訓練時間因時間而異在不同的數(shù)據(jù)集上30分鐘到3小時。
5.3 ?預(yù)處理
? ? ? ?使用Min-Max歸一化方法將數(shù)據(jù)縮放到范圍[1,1]或[0,1]。在評估中,將預(yù)測值重新縮放到正常值,并與真值比較。
對于外部因素,使用獨熱編碼將元數(shù)據(jù)、假日和天氣條件轉(zhuǎn)換為二進制向量 使用Min-Max歸一化將溫度和風速縮放到[0,1]。
5.4 環(huán)境設(shè)置
? ? ? 模型超參數(shù)設(shè)置如下:
? ? ? ?說明:對于所有訓練的模型,只選擇在驗證集上得分最好的模型,并在測試集上進行評估。
5.5?評價指標
5.6?實驗結(jié)果
實驗證明: MVGCN在所有數(shù)據(jù)集上表現(xiàn)最好(除了MAE在出租車NYC)。
5.7??Results on sudden changes
???圖7給出MVGCN與五條基線在突發(fā)變化情況下的比較,這可能是由異常天氣或交通事件引起的。計算所有區(qū)域每個時隙t與t-1的交通流量差;將所有交通流差絕對值按降序排序,并將前5%時隙定義為發(fā)生突然變化的時間點,剩余95%時隙為正常情況。實驗表明:MVGCN大大優(yōu)于所有其他方法,特別是在出租車TaxiBJ。
? ? ? ?如圖8所示, MVGCN模型在正常情況和突然變化方面都比其方法表現(xiàn)得更好,此外,在后者取得明顯改進。原因可能是MVGCN有效地建模天氣數(shù)據(jù)。
5.8 Results on multi-step prediction
? ? ? 圖9給出了基于RMSE和MAE的多步預(yù)測結(jié)果。對于單步預(yù)測模型,MVGCN,我們?yōu)椴煌臅r間步驟訓練不同的模型。
對于包括FC-LSTM和DCRNN在內(nèi)的多步預(yù)測模型,使用前6個時間步長作為輸入序列,接下來的6次作為目標序列,訓練模特。 步數(shù)從1到6MVGCN 是魯棒的,RMSE和MAE都有小的增加,在所有6時間步長中都達到了最佳效果。
隨著時間步的增加,原始GCN是不穩(wěn)健的。這表明如果我們以簡單的方式將現(xiàn)有的模型應(yīng)用于人群流量預(yù)測,它就不起作用。DCRNN表現(xiàn)不太好,因為它也只使用最近的時間步中的序列,導(dǎo)致它無法捕獲周期、趨勢和外部因素。
5.9 ?Effects of Different Components
? ?圖10展示了基于RMSE和MAE的不同時間視圖組合的不同實驗效果,包括最近(視圖1)、每日(視圖2)、每周(視圖3)、每月(視圖4)、季度視圖(視圖5)。 只要考慮最近的觀點,就會得到一個糟糕的結(jié)果當考慮到日視圖時,結(jié)果得到了很大改善,表明周期性是交通流模式的重要特征。此外,隨著更多的時間視力圖的考慮,結(jié)果變得越來越好。
5.10 ?Geospatial position
? ? ? ?沒有地理空間信息,卷積層被降級為普通圖卷積。表4顯示:沒有地理空間位置,RMSE從23.15增加到23.64,MAE也變得更差,證明了空間圖卷積的有效性。
5.11 Global information
? ? ? ?論文比較了MVGCN在兩種設(shè)置下的性能:去除外部因素或元數(shù)據(jù),如表4所示。通過消除外部因素,RMSE從23.15增加到24.41。 同樣,沒有元數(shù)據(jù),RMSE增加到23.23。 結(jié)果表明,外部因素/Meta數(shù)據(jù)影響STG的預(yù)測。
5.12 Huber loss and number of GCN layers
??? ? 為了進一步研究不同損失函數(shù)和GCN層數(shù)的影響。論文進行了一些消融研究,并報告了在TaxiNYC數(shù)據(jù)集上,不同空間圖卷積層或損失函數(shù)的實驗結(jié)果。
? ? ? ?圖11顯示,使用RMSE、MAE或Huber作為損失函數(shù)的性能首先下降,然后隨著GCN層數(shù)量的增加而增加。當GCN層數(shù)為5時,會出現(xiàn)最佳結(jié)果。
? ? ? ?圖11表明,深網(wǎng)絡(luò)產(chǎn)生了更好的結(jié)果,但更深的網(wǎng)絡(luò)仍然造成了共同的問題較高的預(yù)測誤差。 早期停止的訓練時間隨模型深度的增加而增加。
?
? ? ? ? 為了驗證殘差GCN層的影響,論文將有殘差的GCN單元與無殘差的普通GCN層比較。,沒有剩余連接。
? ? ? ? 圖12顯示,兩者在淺層網(wǎng)絡(luò)中的表現(xiàn)相似。但當GCN的數(shù)量增加到5,殘差網(wǎng)絡(luò)可以獲得更好的結(jié)果,并且它們都比淺層網(wǎng)絡(luò)在適當?shù)纳疃仍O(shè)置時表現(xiàn)得更好。
6. CROWD FLOW FORECASTING SYSTEM IN IRREGULAR REGIONS
? ? ? 論文作者在內(nèi)部開發(fā)了一個可以訪問的不規(guī)則區(qū)域的人群流量預(yù)測演示(稱為城市流量)
? ? ? ?圖13(a)顯示了系統(tǒng)中某個區(qū)域的流入和流出結(jié)果,其中綠線表示過去14小時的地面真實流入或流出,藍色線表示14小時內(nèi)的預(yù)測結(jié)果,橙色線表示未來10小時內(nèi)的預(yù)測值。
? ? ? ?可以看到,綠色和藍色線條有非常接近的值和相似趨勢,這意味著MVGCN可以在交通流量預(yù)測系統(tǒng)中有效和良好地工作。
? ? ? ? 圖13(b)顯示了整個城市不同時間戳的總體流量變化的另一個函數(shù)視圖。 在早晨的高峰時間,大多數(shù)地區(qū)有更大的人群流動,因為人們從家里出發(fā),而在下午,大多數(shù)人在工作或休息。
?
總結(jié)
以上是生活随笔為你收集整理的MVGCN 人群流量预测模型 笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vs2015水晶报表(Crystal R
- 下一篇: win7怎么修改服务器端口,教你在Win