一種基于LSTM神經網絡的短期用電負荷預測方法
0 引言
當今社會中,隨著傳感器技術、實時監測與數據存儲技術的飛速發展,電力數據量和復雜度也呈指數增長,這一現象在用戶側尤為突出。如何發掘用戶側海量數據的價值,對大量數據進行高效合理的應用成為當今智能電網時代下亟待解決的問題[1]。
負荷預測基于電力負荷歷史數據,旨在通過研究負荷數據自身的相關性及變化情況,社會條件以及其他自然情況(如溫度)之間的內在聯系,探索出負荷的發展規律,從而對未來某一時間段的負荷數據進行預測的方法。電力系統由電網和電力用戶組成,電網的作用即為各類用戶提供滿足要求的電能,由于電能的不可儲存性,如何合理地實現供電負荷分配,進而保證穩定性和經濟性成為電網部門面臨的重要問題。負荷預測在解決上述問題的過程中扮演了重要角色,英國的研究結果表明,短期負荷預測的誤差每增加1%將導致每年運行成本增加約1 770萬英鎊。在挪威,每增加1%的短期負荷預測誤差將導致455萬~910萬歐元的附加運行成本[2];對于電網而言,準確地負荷預測可對發電廠的出力要求提出預告,合理地安排本網內各發電機組的啟停,使系統始終運行在要求的安全范圍內。
根據預測結果分類,負荷預測可分為短期負荷預測和中長期負荷預測。對于短期負荷預測,國內外研究方法主要可以概括為以下2類:一類是以時間序列法為代表的傳統方法;另一類是以人工神經網絡法為代表的新型人工智能方法。前者主要有時間序列法、多元線性回歸法及傅立葉展開法等[3],這些方法多以純數學理論為根基,難以適應日新月異的電網發展和用戶側日益提高的需求而被逐漸淘汰。而在新型人工智能方法中,運用最為典型的是神經網絡法。文獻[2,4]運用了神經網絡中最為普遍的BP神經網絡,采用Levenberg-Marquardt算法進行訓練,該方法預測效果受到BP網絡結構簡單、學習能力較差的限制,達不到很高的精度。隨著研究的進展,單一的神經網絡方法逐漸顯露出了它的局限性,將神經網絡與其他算法相結合的思想為越來越多的研究人員所采用。文獻[5]提出了一種基于粒子群算法的神經網絡方法進行短期負荷預測,通過粒子群算法優化網絡初始值以及每個階段網絡的參數。除了代表性的神經網絡算法以外,信息時代的發展也使得負荷預測的方法越來越多元化,文獻[6]提出了基于小波聚類的方法對配變負荷進行預測研究;文獻[7]采用了隨機森林算法進行負荷預測。
短期負荷主要用于預測未來幾天的負荷數據。而對于日負荷數據而言,具有很強的周期性,具體體現在以下幾點[3]:不同日的日負荷曲線其整體規律相似;同一星期類型日負荷規律相似;工作日、休息日負荷規律各自相似;不同年度法定節假日的規律相似。
針對日負荷數據周期性很強這一特點,本文提出了一種基于LSTM神經網絡的負荷預測方法。LSTM神經網絡是基于循環神經網絡(Recurrent Neural Networks,RNN)改進的一種人工智能算法,對于處理時間序列相關的數據有很好的效果。而后以負荷數據自身為訓練數據和輸出標簽,通過迭代訓練的方法建立負荷預測模型,該方法可充分利用負荷數據之間的相關性,從而提高負荷預測的精度,同時降低所需歷史數據的維度大小。最后通過實際數據進行仿真實驗,并與傳統的負荷預測方法進行對比,證明該方法具有更高的精確度和更快的收斂速度。
1 基于LSTM神經網絡的模型建立
1.1 LSTM神經網絡原理
LSTM神經網絡最早由Hochreiter等提出[8],并由Graves進行改進[9],是基于RNN的一種完善,解決RNN 中易出現的梯度消亡問題。
RNN相比于與普通的神經網絡,最大的區別就是各個隱藏層單元并不是相互獨立的,各個隱藏層之間不僅相互聯系,還與此隱藏層單元所接受時刻之前的時序輸入有關,這個特性對于處理與時序相關的數據有極大的幫助。單個RNN隱藏層單元展開圖如
如圖所示,U,V,W分別為輸入到隱含層、隱含層到隱含層、隱含層到輸出的權重,x為神經網絡的輸入,O為神經網絡的輸出,S為隱含層當前的時刻狀態。在傳統神經網絡中,每一個網絡層的參數是不共享的。而在RNN中,每輸入一步,每一層都各自共享參數U,V,W。這反映出RNN中的每一步都在做相同的事情,只是輸入不同,這樣的訓練方式大大降低了網絡中需要學習的參數,在保證精度的前提下極大地縮短了訓練時間。
但RNN存在這樣一個問題[8]:對于標準的RNN架構來說,在實踐中可聯系的“上下文”十分有限,較遠時刻的“記憶”對于輸出的影響要么衰減的很小,要么呈指數爆炸增長,這個問題通常被稱為“梯度消亡問題”。
而LSTM則是一種用于解決梯度消亡現象的改進型RNN。LSTM單元結構[9]如
1.2 基于LSTM網絡的負荷預測模型建立
1.2.1 輸入數據的預處理
由于在數據采集過程中,存在人為操作不當、設備老化等情況的影響,造成壞數據的產生,極大地影響預測模型的準確度,因此在輸入訓練數據前需要對樣本中的壞數據進行識別與處理。
本文基于負荷數據的周期性,假定短時間內數據橫向相似,即不會有突變,采用橫向比較法進行壞數據的識別處理[10],利用樣本統計指標與設定閾值判斷是否有非正常數據,因傳感器采樣頻率為每30 min一個點,故所采集的數據為n天48個單位的矩陣,處理具體步驟如下:
1)首先基于式(1)、(2)計算序列的均值與方差。
2)再通過式(3)進行3σ原理的非正常數判斷,其中ε為閾值,通常取1~1.5。
其中 為Xn,i附近2個橫向負荷點,
經過歸一化之后變為矩陣:
這里 為變量的極差,經過式(6)變換后,所得負荷數據值均在0~1之間,完成了歸一化。
1.2.2 輸入輸出量的選擇
在對輸入數據進行預處理之后,如何選擇合適的輸入量及標簽來使用神經網絡進行訓練,是建立負荷預測模型中最為關鍵的一步。
本文主要是預測未來某幾天24 h的負荷值,
由3圖對比可以看出,負荷數據按工作日和休息日每周呈周期性變化,周末時用電負荷與工作日相比有所下降,為了更好地利用這一特性,本文采用迭代預測的方式,如要預測12月28號的24 h負荷值,以11月1~7號的歷史負荷數據作為輸入,11月8號的歷史負荷數據作為標簽輸出進行第一次訓練,而后以11月2~8號的歷史負荷數據作為輸入,9號的歷史負荷數據作為標簽輸出進行第二次訓練,以此種方式進行迭代預測直到得到12月28號的負荷預測值,同時,本文將歷史數據采用one-hot編碼后再作為訓練樣本[11],可更好地利用歷史負荷數據的周期性規律。
在時間序列模型階數的選擇上,本文采用了如下方法[11],電力負荷屬于隨機過程,在隨機過程研究中,自相關系數能夠顯示隨機過程是否平穩以及選擇合適的模型階數[12],訓練數據的自相關系數如
1.2.3 LSTM神經網絡結構的確定
確定了輸入輸出量之后,下一步關鍵工作是確定一個合適的網絡結構,網絡結構中,最核心的步驟是先確定輸入輸出節點個數。
1)多模型單變量預測:使用24個不同的神經網絡預測模型分別對應一天中的24 h,此種方法優點是單個網絡結構較為小、參數易收斂;缺點是過程冗雜,同時單個網絡易過擬合,多變量單模型示意如
2)單模型多變量預測:用24個輸出節點代表一天的24 h,同時預測一天各小時的負荷數,在傳統方法中若采用此種結構的網絡,網絡的結構將會極為復雜,會有上千個參數需要訓練更新,極大地影響網絡的運算速度和預測精度。單變量多模型示意如
本文采用多變量單模型方法構建網絡,本文引言中有提到。由于LSTM網絡權重共享方式上與傳統神經網絡的不同,當采用24個輸出節點時,LSTM所需要學習的參數相比于傳統神經網絡大為減少,極
責任編輯:售電衡衡
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市