基于神經網絡算法的用戶竊電行為檢測模型研究
0 引言
近些年,竊電行為屢禁不止,竊電手法也趨向智能化、隱蔽化。除了在供電設施上擅自接線用電,繞越用電計量裝置用電,偽造或者開啟加封的用電計量裝置封印用電,故意損壞用電計量裝置,還會使用倒表器、移相方式、有線遠方控制和無線遙控等智能型竊電[1]。而反竊電工作仍然以人為經驗為主,反竊電采用的方法包括逐相檢查法、力矩法、鉗形表法等,反竊電技術裝備有待提高。被動式查證易疏漏,滲透率低;主動巡查命中率低,效率低下,反竊電技術亟待取得突破[2]。
竊電檢測和分析需要提高信息化程度,充分利用用電大數據[3],挖掘用戶用電習慣,基于機器學習算法,結合鑒別經驗規則,構建大數據反竊電模型,并逐步建立用戶竊電行為檢測和分析系統,分析竊電用戶特征,準確識別高竊電嫌疑的用戶[4-7],從而為電力企業提供智能化的分析策略,為反竊電管理的完善提供有效的技術支持[8-9]。進一步,維護正常的供用電秩序,保證用電安全,保障正常用電用戶和電力企業的利益。
本文主要貢獻在于利用用電數據和相關電力數據集,構建竊電風險等級模型,設計用戶竊電行為檢測系統。首先,介紹所采用的神經網絡框架及模型構建方法;其次,介紹特征工程和數據預處理采用的方法;最后,在真實數據集上驗證模型的有效性以及完善其可擴展性。
1 神經網絡
神經網絡是深度學習的基礎,作為經典的機器學習框架,已在諸多領域的大數據應用中取得了廣泛應用[10]。
1.1 神經元與多層網絡
神經網絡是由具有適應性的簡單單元組成的廣泛并行互連的網絡,能夠模擬生物神經系統的交互和學習過程。
元神經網絡中的功能神經元,接收到來自其他神經元的輸入信號xi(i=1,2,…n),通過帶權重wi(i=1,2,…n)的連接進行傳遞,神經接收到的總輸入值將與其閾值θ比較,然后通過“激活函數”(Sigmoid函數、logistic 函數等)處理以產生輸出y。
權重和閾值可以通過學習得到。功能神經元模型如
要解決非線性可分問題,需疊加單層感知器,常見的神經網絡結構為“多層前饋神經網絡”,包含輸入層、輸出層以及之間的一層或多層的隱藏層[11]。
1.2 誤差逆傳播算法
誤差逆傳播(error Back Paopagation,BP)算法是訓練神經網絡的迭代學習算法,采用隨機梯度下降進行參數尋優,其算法如下。
則網絡在此樣本上的均方誤差為:
單隱藏層前饋神經網絡結構示意如
2 竊電風險等級模型
2.1 數據輸入與特征提取
模型初始訓練的數據集來自于湖州部分地區2016年第四季度的用戶用電數據,采集于21 623個低壓用戶戶號和17 779個專變用戶戶號,其中包含646個已查驗確認的低壓竊電用戶。
根據竊電特點及其受竊電行為影響的計量指標,專變用戶主要從瞬時電壓、瞬時電流、三相不平衡、日用電量、月最大需量等方面提取模型特征,低壓用戶主要從日用電量、用電量變化、尖峰平谷時期用電量、所在臺區線損、線損變化等方面提取模型基本特征,從而全面刻畫用戶用電模式和規律,及其對電網產生的影響[13]。
主要特征和對輸入數據的預處理如下:
1)用電量時間序列:一階差分觀測期內的電表讀數,獲取日用電總量和尖峰平谷各時間段用電量的時間序列數據。
2)平均電表讀數:對觀測期內用戶電表讀數統計值取均值,作為用電基數輸入。
3)月最大需量:觀測期內各月用戶電量最大需量。另外,提取月最大需量與實際用電量差異值
特征。
4)所在臺區線損:用戶所在臺區的線損率、臺區用戶數、臺區用電量,反映所在臺區線損程度和竊電用戶分布的比例。
5)電壓三相不平衡:根據IEEE Std 12-2004的定義,由三相相電壓值
數據清洗過程中,對超過20%用電量數據存在異常值的用戶進行剔除。用均值填充剩余數據集中用電量缺失值,對于異常值點以臨近處均值擬合。
根據均值µ和方差σ對特征值進行z-Score的標準化:
Sigmoid函數具備求導的很好的性質計算梯度,
ROC空間將偽陽性率(False Positive Rate,FPR)定義為X軸,真陽性率(True Positive Rate,TPR)定義為Y軸,因此曲線距離左上角越近,證明分類器效果越好。同樣,AUC(Area under the Curve of ROC)也用來對模型的效果進行評估,其值為ROC曲線所覆蓋的區域面積,AUC越大,模型整體性能越好。該竊電用戶檢測模型平均AUC達到0.85,反映了其良好的分類效果和健壯性。
對模型的輸出進行變換,按竊電嫌疑(用戶被分類為竊電用戶的可能性)劃分竊電風險等級。竊電嫌疑值高于0.8的為高可疑用戶,作為排查重點,0.6~0.8為中度可疑用戶,0.6以下為低可疑用戶,其中的高可疑用戶是重點關注和排查的對象。
利用湖州部分地區2017年第二季度的來自
34 520個用戶的真實用電數據,輸入模型查詢高嫌疑值的竊電用戶。經過實際檢查,模型返回的高可疑竊電用戶命中率達到0.75,驗證了檢測模型的有效性。
通過現場操作人員的確認和分析,對未命中用戶的誤判異常指標記錄,結合正向反饋的數據,對模型進行增量訓練。
2.4 模型的應用
基于機器學習的算法和歷史用電數據訓練竊電風險等級模型,作為竊電用戶識別系統的計算核心支撐,構成用戶竊電行為檢測系統的核心模塊。用戶竊電行為檢測系統架構如
3 展望
現階段基于神經網絡的用戶竊電檢測與分析,模型的分類能力和準確率、召回率均有待提高,下一步將加入隨機森林、梯度提升樹等算法模型模塊,利用模型集成提升學習能力[18]。數據集的連續有效保障用戶竊電等級模型的泛化能力和精準程度。數據倉庫正在構建,數據存儲和查找的效率需要進一步提高。對竊電用戶的查處和標記需要增加各項指標的記錄,如竊電起止時間、竊電方式、竊電量等,數據質量的提高將進一步促進模型的優化。
4 結語
傳統的反竊電技術工作量大、滲透率低,本文基于用戶用電數據和相關電力數據提取特征指標,利用BP神經網絡算法實現竊電風險等級監測模型,模型在湖州市真實數據實例驗證上展現了高準確率和命中率,較以往隨機排查、經驗規則,以更高的科學性和實用性提升了反竊電技術的信息化和智
能化。
責任編輯:售電衡衡
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市