混合聚類分析算法在發(fā)電設(shè)備故障模式識別中的應用
0 引言
大型火電廠主、輔機數(shù)量較多,結(jié)構(gòu)復雜,其作用是完成從熱能到機械能再到電能的轉(zhuǎn)換過程。設(shè)備與設(shè)備之間的耦合性、系統(tǒng)的復雜性等因素決定了火電廠是一個高故障率和故障危害性很大的生產(chǎn)場所,這些故障都將造成重大的經(jīng)濟損失和社會后果,因此應用設(shè)備故障預警及狀態(tài)監(jiān)測技術(shù),掌握關(guān)鍵設(shè)備的正常運行狀態(tài),及時發(fā)現(xiàn)易損部件的工況惡化趨勢,及時進行維護和檢修,對提高設(shè)備的可靠性和安全性十分必要[1-5]。
目前,發(fā)電設(shè)備預警和預知維修的關(guān)鍵技術(shù)主要有狀態(tài)監(jiān)測技術(shù)、故障診斷與預測技術(shù)和維修分析與決策,而故障模式識別是這些技術(shù)的基礎(chǔ)。本文采用K-means算法與基于EM(期望最大)的高斯混合模型(Gaussian Mixture Model,GMM)算法相結(jié)合的聚類分析算法進行故障模式識別,實踐結(jié)果證明該算法能夠很好地用于發(fā)電設(shè)備智能診斷預測。
1 算法介紹
1.1 K-means算法
K-means算法,也被稱為K-平均或K-均值算法,是一種得到廣泛應用的聚類分析方法[6]。該算法的主要思想是:將各個聚類子集內(nèi)所有數(shù)據(jù)樣本的均值作為該聚類的代表點,通過迭代的方法逐次更新各聚類中心的值,把數(shù)據(jù)集劃分為不同的類別,最終目標是使評價聚類性能準則的函數(shù)達到最優(yōu),使生成的每個聚類(簇)內(nèi)緊湊,類間獨立[7-10]。
假設(shè)要把樣本集X={x1, x2, x3,…, xn}分為K個類別,算法的過程描述如下:
算法:K-means算法,劃分并計算基于簇中對象的平均值;
輸入:簇的數(shù)目
輸出:
算法步驟:
1)為每個聚類確定一個初始聚類中心,形成K個初始聚類中心;
2)將樣本集中的樣本按照最小距離原則分配到最鄰近的聚類;
3)利用每個聚類中的樣本均值作為新的聚類中心;
4)重復步驟2和步驟3,直到聚類不再變化;
5)迭代結(jié)束,得到K個聚類。
K-means算法的優(yōu)點是算法快速、簡單,對大數(shù)據(jù)集有較高的效率并且是可伸縮的。缺點是需要根據(jù)初始聚類中心來確定一個初始劃分,然后對初始劃分進行優(yōu)化。在K-means 算法中,多維空間相似性度量基于歐氏距離進行計算,并不能準確反映多維空間點中的相似情況。
1.2 高斯混合模型(GMM)
1.2.1 多維空間單高斯模型(SGM)
假設(shè)有一組在多維空間(假設(shè)維度為D)的點Xi,i=1,2,…,n,若這些點的分布近似橢球狀,則可以用高斯密度函數(shù)g(X,μ,Σ)來描述產(chǎn)生這些點的密度函數(shù):
由于xi為己知點,可通過p(X;μ,Σ)來求解μ和Σ。這類問題通常以極大似然估計的方法來進行求解,即在p(X;μ,Σ)為最大值條件下(樣本點xi已經(jīng)發(fā)生,故可認為p(X;μ,Σ)樣本xi發(fā)生的概率最大),求得μ和Σ。根據(jù)極值理論,可以通過對μ和Σ分別求導的方式求解。
1.2.2 高斯混合模型(GMM)
SGM樣本點的分布為橢球狀。而實際中,大部分樣本點分布不可能是或近似橢球狀,因此引用了高斯混合模型(GMM)。GMM是一種常用的描述混合密度函數(shù)分布的模型,可視為多個高斯分布以一定比例混合而成[11-14],GMM模型可描述為:
Fig.1 Solution program
基于K-means與GMM結(jié)合的聚類分析算法描述如下:
1)引用初始K個高斯混合模型,其初始參數(shù)為A0、Mu0、Σ0;
2)在第1次迭代中,通過最大期望算法得到A1、Mu1、Σ1;
3)將更新后的高斯模型進行第2次迭代,得到A2、Mu2、Σ2;
4)進行多次迭代后,值變化達到殘差設(shè)定值,則迭代結(jié)束,得到最終A、Mu以及Σn。
2.2 模型相似度算法詳解
在得到高斯混合模型的數(shù)學求解結(jié)果后,計算機基于EM算法不斷求解和迭代可以得到GMM各個模型的參數(shù)μ和Σ。在現(xiàn)場得到的實時數(shù)據(jù)將與GMM中的模型期望值進行相似度比較,相似度最高的期望值將作為實時數(shù)據(jù)的期望值。
對于2個D維數(shù)據(jù)對象X={x1, x2,…, xd}和Y={y1, y2,…, yd},相似度計算方法如下:
圖2 前置泵電機溫度訓練樣本與期望值趨勢圖Fig.2 Training sample and expected trend of front pump motor temperature
從實例可以得出,采用K-means(K均值)與基于EM的GMM算法相結(jié)合的聚類分析算法能夠?qū)Πl(fā)電設(shè)備故障模式進行提取,并以此作為故障模式識別的依據(jù),對于1 000個樣本的驗證結(jié)果,經(jīng)檢驗后發(fā)現(xiàn)其與實際情況基本吻合。
4 結(jié)語
本文針對火力發(fā)電機組發(fā)電設(shè)備故障預警的難題,研究了K-means與GMM結(jié)合的聚類分析算法,應用 K-means初始化構(gòu)建混合高斯模型,使用 EM 算法進行參數(shù)估測,并建立了完整的分類模型,驗證了該數(shù)據(jù)挖掘技術(shù)在故障診斷中應用的可行性,為發(fā)電設(shè)備的預警和預知維修奠定了基礎(chǔ)。
責任編輯:售電衡衡
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計 -
中國自主研制的“人造太陽”重力支撐設(shè)備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng)
-
新基建助推 數(shù)據(jù)中心建設(shè)將迎爆發(fā)期
2020-06-16數(shù)據(jù)中心,能源互聯(lián)網(wǎng),電力新基建 -
泛在電力物聯(lián)網(wǎng)建設(shè)下看電網(wǎng)企業(yè)數(shù)據(jù)變現(xiàn)之路
2019-11-12泛在電力物聯(lián)網(wǎng) -
泛在電力物聯(lián)網(wǎng)建設(shè)典型實踐案例
2019-10-15泛在電力物聯(lián)網(wǎng)案例
-
新基建之充電樁“火”了 想進這個行業(yè)要“心里有底”
2020-06-16充電樁,充電基礎(chǔ)設(shè)施,電力新基建 -
燃料電池汽車駛?cè)雽こ0傩占疫€要多久?
-
備戰(zhàn)全面電動化 多部委及央企“定調(diào)”充電樁配套節(jié)奏
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計 -
中國自主研制的“人造太陽”重力支撐設(shè)備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業(yè)發(fā)展
-
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng) -
5G新基建助力智能電網(wǎng)發(fā)展
2020-06-125G,智能電網(wǎng),配電網(wǎng) -
從智能電網(wǎng)到智能城市