風電+AI:實現齒輪箱故障預警,降低風機嚴重故障風險
當齒輪箱發生輕微故障時,若人工定檢不能及時發現,小故障會伴隨著風機繼續運轉,增加齒輪箱負荷,最終導致卡死、串軸、斷裂等嚴重故障,給風場帶來巨大的維修成本。
在政策驅動下,我國的風電行業已由快速發展逐步轉向穩定、市場化發展。相較于較水電、光伏等新能源,風電行業的信息化較為成熟,因而具備較好的智能化條件和基礎。其中,基于風場采集的SCADA數據進行故障診斷、故障預測建模,已成為風電行業的重要趨勢。
在典型的大部件中,風力發電機齒輪箱,亦稱變速箱,作為將葉輪轉速提速為發電機所需轉速的重要部件,在雙饋式風力發電機中應用廣泛。
當齒輪箱發生輕微故障時,若人工定檢不能及時發現,小故障會伴隨著風機繼續運轉,增加齒輪箱負荷,最終導致卡死、串軸、斷裂等嚴重故障,給風場帶來巨大的維修成本。
如果能通過數據及時發現齒輪箱的運行異常并實時報警,對于降低風機嚴重故障風險,提高風場發電效率具有重要意義。
文:天數潤科 劉楊
齒輪箱數據概述
風力發電機的故障診斷、故障檢測方面,常使用的數據有SCADA、CMS等數據。
SCADA作為集控系統的組成部分,其數據存儲、提取、建模的過程較為容易。通常,對齒輪箱的測點包括齒輪箱油溫、齒輪箱振動、齒輪箱軸轉速、齒輪箱軸承溫度等。
CMS通過采集高頻振動數據,結合時域與頻域的分析,給出齒輪箱振動異常的原因與是否需要停機維修的判斷。
本次建模使用的數據為10s級別的SCADA數據,包含以上提及的SCADA數據特征。
建模思路
由于SCADA數據中齒輪箱的測點數較少,難以完全描述齒輪箱的運行狀況,同時數據質量不佳,部分風機數據的時間間隔為12s,導致瞬時采樣點數據時間戳不一致。針對這種情況,采用數據聚合的方法,將不同時間間隔的數據統一聚合為2min級別數據,提取每個特征在該段時間內的平均值、最小值、最大值。
采用聚合方式提取的數據,存在嚴重的線性相關,使用傳統的統計學習方法(不包含樹模型)會引入較大的誤差,因此需要一層濾波,從原始的聚合數據中提取深層特征,同時需要確保這些特征可以較好地還原數據。因此模型使用降噪自編碼器作為自動進行特征提取的工具。
按照2min的時間跨度聚合的數據較風電行業常用的10min級別數據,其時序特征較為明顯。尤其在溫度等特征方面,2min級別數據中描述了詳細溫度的變化特征,能夠較好的反應風機運行過程中真實發生的工況。因此,在故障預測方面,采用基于LSTM架構的模型,以有效預測齒輪箱健康狀況。
訓練數據的標注方面,風場提供了齒輪箱故障發生的時間,將故障發生前一周的數據均標記為故障數據,同時選取一部分的齒輪箱未發生損壞的風機數據,以標簽0作為正常風機的標注,用以訓練模型。
首先,針對SCADA數據,進行按照時間聚合的數據操作;其次,構建降噪編碼器模型,通過處理后的數據訓練編碼部分和解碼部分,自動地使用神經網絡提取2min級別數據的深層特征;最后,通過數據標簽訓練LSTM,輸入編碼后的結果,輸出為風機在該時間段內是否發生故障的預測結果。
所有的算法開發與部署皆基于SkyAXE高速運算平臺開發。
1.png
模型算法說明
降噪自編碼器(Denoising AutoEncoder)是一種較為魯棒的自動特征提取模式,通過在編碼前對數據引入噪聲(通常為高斯噪聲)破壞原始的數據分布,再通過編碼-解碼過程還原未加入噪聲的數據,實現類似濾波(filter)后自動提取特征的過程。
2.png
通過引入噪聲,破壞原始數據的標準分布后,再通過數據將其還原,模擬了人類對破損圖像自動補全的過程,充分利用數據間的相關性,自動提取數據的深層特征,在大批量數據的特征提取方面,其效果較傳統的PCA降維方法都有顯著地提升,且具有較高的魯棒性。反映于模型中,可看到其對聚合之后特征的還原效果較好,因此可將編碼器部分作為LSTM網絡的前半部分,對原始特征進行預處理:
3.png
LSTM通過引入Cell的結構,可記憶在時間序列上有所間隔的數據特征,在自然語言處理、視頻分析、信號分析等方面已有大量成熟應用。其結構不在贅述。
模型架構
模型整體架構為降噪自編碼器的編碼部分后接LSTM網絡結構,構建模型需要以下幾個步驟:
4.png
Step 1:訓練自編碼器
由于降噪自編碼器屬于無監督學習的神經網絡,即不需要外部的標簽來訓練。輸入輸出均為原始特征。訓練中仍然采用批量訓練方法,此時不需要關注聚合數據的故障與否,將全部數據進行訓練即可得到能夠自動提取深層特征的編碼器;
Step 2:構建LSTM網絡
由于數據量較大,LSTM模型的堆疊Cell數量較多,網絡較深,容易產生梯度爆炸或梯度消失的問題。采用批標準化(Batch Normalization)對每一層的輸出進行標準化,解決梯度傳播的問題。同時,為了避免模型過擬合,在LSTM層和全連接層中,均使用了Dropout,降低過擬合的概率。構建起多層的LSTM網絡后,接收編碼器提取的深層特征;
5.png
Step 3:訓練模型
使用降噪編碼器提取的深層特征作為LSTM的數據,故障與否作為標簽,訓練LSTM模型。從訓練誤差的下降來看,模型具有較好的穩健性,誤差可穩定的下降:
6.png
Step 4:
模型測試
測試數據集為未用于訓練的同風場其他幾臺風機數據,運行正常的風機沒有報出故障,誤報率接近于0。而故障風機主要呈現以下兩種故障模型:
(1)突發故障
可能是由于瞬時風速過大,符合較大而導致的突發故障。模型在故障發生前并無給出明顯的征兆,在系統報警的較近時間段才報出異常,此時風機可能已經處于齒輪箱故障發生的臨界點,需要緊急停機進行維修;
7.png
(2)漸變故障
8.png
此類故障在發生前一段時間,模型已給出一些警報,此時對齒輪箱進行人工檢查或維修,可以避免因嚴重故障導致的齒輪箱徹底更換,降低維修成本,提高風場的運營效率。
總結
齒輪箱是雙饋式風力發電機的重要部件,其發生嚴重故障后更換齒輪箱的維修成本極高。若能盡早發現齒輪箱的損壞,并進行及時的維修,對于指導現場人員作業,實現智能化運營具有重要意義。
雖然模型有效地解決了該風場的離線數據問題,但在實際部署過程中,還需要考慮數據傳輸的質量、速度等因素,對模型參數進行不斷修正,以提高預警的準確率。
隨著風場信息化程度的不斷提高,智能化必然成為風電行業未來的發展方向。引入AI的建模方法,將有助于提高模型的預測準確率,降低誤報率,為業主帶來真實的經濟價值。
責任編輯:小琴