论文笔记:基于特征选择与增量学习的非侵入式电动自行车充电辨识方法
目錄
1. 前言
2. 背景
3. 電動自行車充電負荷特征
3.1 特征分析
3.2 排序與選擇
4. OCSVM
5. 增量式學習
6. 實驗驗證
6.1 樣本采集和事件監測
6.2 特征選擇
6.3 增量學習及負荷辨識驗證
7. 總結和思考
1. 前言
????????本文是對以下論文的解讀筆記。注意在下文中“該論文”和“本文”是指向不同的對象。文中著色高亮部分為一些有疑問的地方或者本文作者所加的解讀comment。最后一章也給出了本文作者的關于這個問題的一些思考。
????????施雨松等:基于特征選擇與增量學習的非侵入式電動自行車充電辨識方法, 電力系統自動化 Vol.45 No.7 Apr.10.2021
????????論文摘要:為實現從電網側監測電動自行車違規停放充電行為,減少電動自行車充電火災事故,在非侵入式負荷識別的基礎上,提出一種基于特征選擇與增量學習的電動自行車充電辨識方法。首先,根據電動自行車充電實測電流波形,分析負荷特性并列舉15種負荷特征。通過半監督Fisher計分與最大信息系數(MIC: Maximal Information Coefficient)量度特征辨別度與冗余度,采用貪心搜索算法對特征重要性排序并結合排序與辨識結果選擇辨識準確性最高的特征子集。然后,基于一類支持向量機增量學習方法,實現電動自行車負荷辨識與分類器在線學習。最后,通過實測數據進行試驗,結果表明文中方法可以對電動自行車充電行為準確辨識,驗證了算法的有效性。
2. 背景
????????近年來,電動自行車成為城鎮居民短途出行的主要交通工具之一,同時其相關安全問題也日益突出,其中電動自行車引發的火災呈多發、頻發趨勢。2018 年,公安部發布《關于規范電動車停放充電加強火災防范的通告》,明確指出規范電動自行車停放充電行為,嚴厲查處違規停放充電行為,嚴禁在建筑內的共用走道、樓梯間、安全出口處等公共區域以及個人房間內為電動自行車充電[1]。嚴格監管電動自行車充電行為可以有效減少火災事故,但由于電動自行車充電行為存在隨機性、隱蔽性(用另一個專業術語來說叫做“非合作性”),僅依靠人力巡查電動自行車違規停放充電行為,效率低并且漏檢率高。隨著智能電網技術的快速發展,基于非侵入式負荷監測與分解方法實現電網側電動自行車充電行為辨識具有良好的發展前景。
????????到目前為止的NILM的研究主要針對多類電器負荷分解,尚無針對電動自行車或一類異常電器的辨識方法研究。
????????本文以非侵入式負荷監測為背景,針對電動自行車充電一類負荷,采用半監督特征選擇方法,分析15 類負荷特征的辨別度與冗余度,基于貪心搜索與一類支持向量機(one-class support vector machine,OCSVM)進行排序并提取分類正確率最高的特征子集。考慮電動自行車品類繁多但每戶電動自行車數量較少,結合增量學習與OCSVM 進行識別過程中的在線學習,在保持泛化能力的同時加強針對性。
????????非侵入式負荷識別的關鍵步驟為事件檢測、特征選擇和負荷識別。當然,通常在事件檢測之前還有一個數據預處理的步驟。本文主要聚焦于特征選擇和負荷識別這兩個階段。事件檢測與常規的NILM是共通的。
????????In short, 本論文的精華就是以下三個要點:
3. 電動自行車充電負荷特征
3.1 特征分析
????????不同的電器擁有不同的負荷特征。居民用電電壓較為穩定,負荷特征差異主要體現在電流波形不同,電動自行車充電實測電流波形如圖1 所示。
????????與普通各類家用電器電流波形相比,電動自行車充電電流波形非線性程度較大、畸變嚴重,瞬時功率峰值較高,啟動時有短時的脈沖電流與延遲時間。為了具體反映負荷特性,本文選取了15 個負荷特征作為初始特征集,特征提取方法不再詳述,特征編號與名稱如表1 所示。
?
????????以上特征中C11~C13 為V-I 軌跡的3 個量化參數,V-I 軌跡是以一周期的電壓與電流標幺值分別作為橫、縱坐標繪制的曲線。V-I 軌跡可以有效反映電力電子型負荷特性,其中C11 表征負荷非線性程度,C12 體現負荷內部元件的導通性,C13 表示負荷電流與電壓峰值相位差。電動自行車V-I 軌跡如圖A1 所示。?
圖A1 電動自行車V-I軌跡圖
3.2 排序與選擇
????????負荷辨識并非特征類型越多越好,其中辨別度較低的特征會干擾判別,冗余度較高的特征集難以有效提高辨識精確性,同時又增加了計算成本。因此,需要選擇辨別度高、冗余度低的特征子集作為辨識依據。
????????本論文基于半監督Fisher計分和最大信息系數,以辨別度最大、冗余度最小作為目標從上節所示15個候選特征中選取合適的子集,其過程如下所示:
????????第1個選擇的特征F1按如下方式選取:
????????????????
?????????其中di為第i個特征的辨別度,本論文中選用前述半監督Fisher計分來表征特征的辨別度;ri表示第i 個特征與其余所有特征的冗余度均值,本論文中選用最大信息系數(maximal information coefficient,MIC)來衡量兩個特征之間的相關性(也即它們之間的冗余度,比如說相關性為1表示由其中一個完全可以推得另一個,那么作為辨識特征來說其中有一個就是完全冗余的)。
????????第n(n>1)個選擇的特征Fn為:???????????????????????
???????????????????????
????????式中:Fs 為已入選特征子集;r(Fi∪Fs)為第i個特征與已入選特征的冗余度均值.
????????以上選擇過程得到了一個按照辨別度從高到低的有序的特征子集。然后分別基于特征子集 進行訓練并測試,得到在識別性能與子集大小之間取得最佳trade-off的最優特征子集。
????????以上描述中“半監督Fisher計分”和“最大信息系數”。。。呃。。。一知半解所以暫時略過,等補完課搞明白了再來報告^-^.
4. OCSVM
本論文把電動自動車充電識別看作是一分類問題,即判斷“是”還是“不是”。把沒有電動自行車充電時的日常家用電器工作的狀態定義為“negative”狀態,而電動自行車充電疊加在日常家用電器工作的狀態定義為“positive”狀態(當然,反過來定義也可以)。OCSVM算法的目標就是要在發生電器投入事件(注意,在本問題中其實不太需要關心切出事件。畢竟檢測的目的在于及時提出警告并中止充電行為)時,識別出當前投入的電器“是電動自行車”還是“非電動自行車”。
????????關于OCSVM的介紹有很多參考文獻和網絡資源(比如說,我之前寫的以下兩篇博客(Ref1, Ref2),其實就是為了解讀本論文而做的準備工作^-^),本文重點不在這里,所以這里就不再贅述了。
5. 增量式學習
????????籠統地說,增量學習是指算法在保留已有知識的同時不斷從新樣本中學習新的知識。
????????OCSVM本身并不具備增量學習能力,基于協同訓練思想,結合OCSVM和增量學習的電動自行車充電辨識的學習過程如下:
????????假設電動自行車初始訓練樣本集為L,x 為此刻從用戶總線提取到的未知標簽的負荷樣本。
????????從訓練樣本集L 中可重復取樣得到3 個訓練樣本集L1、L2 和L3,分別通過核函數不同的OCSVM1、OCSVM2 和OCSVM3 訓練得到3 個不同的分類器Model1、Model2 和Model3。
????????3 個分類器對樣本x 進行辨識分類,采用集成學習中的多數投票(任意2 個分類器分類結果相同)判斷是否為電動自行車負荷樣本。
????????若樣本x 被確認為電動自行車負荷樣本,則只保留3 個訓練樣本集的支持向量,并增加樣本x 構成新的訓練樣本集L′1 、L′2 和L′3,然后利用更新后的訓練樣本集重新訓練,從而更新3 個分類器。
????????若樣本x 被確認為不是電動自行車負荷樣本,則等待下一樣本。
????????如此每次獲得新的負荷樣本時重復迭代更新3 個分類器,實現增量學習。更新訓練樣本集時,只保留支持向量,可避免新增樣本積累導致訓練計算量劇增,同時保留泛化能力。
?????? 【問】為什么要采取增量學習過程呢?
初始訓練是離線式訓練,訓練集只包含有限種類的電動自行車的有限樣本數據,而實際上各家各戶的電動自行車(如果有的話)型號可能千差萬別。所以不太可能基于初始樣本集訓練出來的模型能夠取得較好的識別效果。利用增量學習可以在監測終端安裝以后根據新的數據樣本再對當前家庭進行針對性的在線學習。
6. 實驗驗證
6.1 樣本采集和事件監測
????????為驗證本文方法的有效性,在實際家庭入戶總線處同步采集電壓、電流數據(采樣率是多少?只采集電流和電壓的話,功率類信息就根據瞬時電流、電壓進行計算?)。測試過程中記錄電動自行車負荷接入時間(有標記)。其他家用電器在測試過程中隨機開關且不記錄接入時間(無標記)。同時,本文算法是對電動自行車充電負荷接入事件的監測,只需要用到其開啟1 s 內的電壓、電流數據。實驗時經觀察發現,同一電池在其電量不足和滿電狀態下充電,開啟瞬間的電流波形是相近的,經過幾秒后才進入穩定狀態,因此可以不用考慮電池在充電過程的不同階段充電電流均存在不同的問題。
????????本文通過滑動窗雙邊累積和算法(參見Ref)進行事件檢測,采用有功功率作為檢測信號(如上所述,有功功率應該是根據所采的電流、電壓數據進行計算而得)。某次實驗中,用戶入戶線處測得的有功功率信號,即事件檢測算法的檢測信號如附錄B 圖B2 所示,可見居民用戶有功功率波動較小,電動自行車充電負荷接入時功率有明顯的階躍(但是,從下圖怎么能看出這點來呢?存疑)。根據實際調試情況設置相關參數如下:平均值計算窗口長度Nm=6,暫態過程檢測窗口長度Nd=4,噪音β=10,閾值h=120,可有效減少其他負荷噪音干擾。本文僅關注電動自行車負荷接入事件檢測的準確性,根據檢測統計結果,事件檢測算法的電動自行車負荷接入事件漏檢率低于0.5%,且得到的事件發生時刻準確,時間偏差不大于0.1s(所以,推測采樣率應該至少為數十Hz吧)。利用事件發生時刻前后采樣數據提取負荷特征并形成負荷樣本,分為有標記樣本(電動自行車)與無標記樣本(其他家電)。
圖B2-有功功率信號
6.2 特征選擇
????????基于前面第三章所述方法進行特征排序和特征子集選擇。樣本數量100,包括30個有標簽樣本(對應電動自行車充電投入事件)和70個無標簽樣本(對應其它事件),劃分為訓練集和測試集(其中有標簽樣本比例均與原樣本集相同),測試集中各類型號的電動自行車和家電樣本所占比例與原始采樣樣本集分布基本一致。標準Fisher 計分與半監督Fisher 計分的15 個特征的辨別度計算結果對比如圖2 所示。
????????由上圖可知,半監督Fisher積分的分辨度遠遠好于標準Fisher計分,其中C12的辨識度最高(疑上圖顏色標識錯誤,是不是恰好相反啊?從圖中來看難道不是標準Fisher計分的特征辨識度要遠遠好于半監督Fisher積分嘛?)
????????基于MIC 進行特征集冗余度量度,測試樣本集與上文相同,計算結果為15 階矩陣,表示15 類特征之間的相關程度。根據特征辨別度與冗余度計算結果,基于貪心搜索算法進行特征排序,其中參數α 為0.5。然后基于OCSVM訓練結果可以得到如下圖所示結果:
圖3 特征排序及辨識結果
????????由上圖可知,最優特征子集的大小為9,即取特征辨識度從高到底的9個特征作為特征子集時的辨識性能最好,此時辨識正確率達到96.15%。作為對比,論文還將以上方法與傳統的SVM模型以及BP神經網絡模型進行了對比,結果表明本論文所推薦的方法綜合表現最優(雖然僅比BP神經網絡模型只是稍好一丟丟^-^,所以是否適合于實際工程應用還要看實現復雜度等其它方面的因素)。?
?
6.3 增量學習及負荷辨識驗證
????????根據第5章所述方法實施實際環境下的實驗。
????????初始訓練樣本集包括70 個有標簽樣本(是前文提到的訓練樣本集嗎?前面說的只有30個有標簽樣本,從下文來看應該不是),通過可重復采樣得到的3 個訓練樣本集樣本數為30。增量學習樣本集(其實就是對應以下的三十輪的學習,每得到一個新的樣本數據且判定為電動自行車充電事件就學習一次。因此30次學習就對應著30個有標簽樣本)包括30個有標簽樣本,測試樣本集包括30 個有標簽樣本和100 個無標簽樣本。模擬某戶家庭僅擁有一輛電動自行車的情況,增量學習樣本集與測試樣本集中的有標簽樣本為同一輛電動自行車多次采集所得樣本。為驗證本文方法的有效性,分類器每學習一次就對測試樣本集進行一次辨識,測試結果如圖4 所示。
????????由上圖可知,
7. 總結和思考
????????本文以非侵入式負荷監測為基礎,提出了一種基于特征選擇與OCSVM 增量學習的電動自行車充電辨識方法。低辨識度特征與高冗余度特征集會干擾算法辨識,通過半監督特征選擇方法量度辨識度與冗余度,充分挖掘無標簽樣本信息,采用貪心搜索算法對特征重要性排序,并選擇辨識效果最佳的特征子集。另外,賦予OCSVM 算法增量學習能力,解決初始分類器對于陌生型號電動自行車負荷樣本辨識正確率較低的問題。通過實測數據,驗證了本文所提方法的有效性。半監督特征選擇方法不僅降低了算法的計算成本,而且提高了辨識正確率。增量學習OCSVM 算法有效降低了電動自行車錯誤拒絕率,提高了算法整體性能。下一步,將針對算法辨識與學習速度進行研究,進一步提高算法實用性。同時,本文方法也可推廣應用于其他特殊或異常負荷監測中。
????????My comment:
????????基于非侵入式負荷監測與分解方法實現電網側電動自行車充電行為辨識有兩種路線,第一是基于傳統的NILM的思路,把電動自行車當作另外一種“家用”電器進行識別;第二是把電動自行車充電當作是一種異常事件來處理。兩種思路導致的具體策略迥然不同。本論文討論的是第二種路線。
????????按照第一種路線的話,因為僅僅是家用電器的種類增加了一種而已,因此對傳統的NILM算法處理管道不需要做什么改變,僅僅是用于識別的特征庫等追加對應于電動自行車的識別特征即可。這種路線的好處在于是不需要重新進行算法開發,只要對原有的NILM系統進行適當升級即可。甚至升級后的系統將來可以直接移植到專用電動自行車集中充電站的監測管理。
????????按照第二種路線,只需要區分“是”還是“否”,不需要識別出具有什么時候有哪些電器在使用,可以與傳統的NILM相對獨立地進行處理。但是需要重新開發算法,只有事件檢測這一部分是可以和原NILM系統共用。
????????電動自行車充電檢測與常規的NILM在實時性的要求方面有所區別(需要在路線選擇和算法設計中考慮)。電動自行車違規充電是非法事件,檢測的目的是及時制止以防患于未然,所以對于實時性要求比較高。而常規的NILM只是要確切地辨識出在什么時候有什么電器有多大功耗,對于實時性的要求相對較低(取決于具體的業務要求)。
??? 當前的研究的重點在于違規充電檢測,以后如果基礎設施建設跟上了,違規充電可能自然而然地就消失了,重點可能需要轉向正常的集中充電站的充電監測。。。
Ref1:?論文筆記:Support vector domain description(Tax,Duin1999)_chenxy_bwave的專欄-CSDN博客https://blog.csdn.net/chenxy_bwave/article/details/120906276Ref2:?
論文筆記:Support Vector Method For Novelty Detection(Sch?lkopf)https://blog.csdn.net/chenxy_bwave/article/details/120885445https://blog.csdn.net/chenxy_bwave/article/details/120885445
總結
以上是生活随笔為你收集整理的论文笔记:基于特征选择与增量学习的非侵入式电动自行车充电辨识方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 百度通用文字识别离线SDK部署(c#)
- 下一篇: php easyui filebox,e