近年來,我國高速鐵路(簡稱:高鐵)事業(yè)飛速發(fā)展,高鐵動(dòng)車組列車保有量快速增長,服役車型種類日益增多,高鐵產(chǎn)業(yè)正由制造為主的階段轉(zhuǎn)向全壽命周期運(yùn)營維護(hù)(簡稱:運(yùn)維)為主的階段。因此,提高動(dòng)車組運(yùn)行的安全性和可靠性,降低運(yùn)維成本,具有重大意義。
目前,動(dòng)車組故障預(yù)測(cè)與健康管理(PHM ,Prognostic and Health Management)系統(tǒng)[1]已在全國鐵路投入使用[2],基于對(duì)24種動(dòng)車組關(guān)鍵部件傳感器數(shù)據(jù)的分析,構(gòu)建了預(yù)警預(yù)測(cè)、視情維修等故障診斷和預(yù)測(cè)應(yīng)用。2021年,動(dòng)車組PHM系統(tǒng)(由中國鐵路上海局集團(tuán)公司開發(fā)的部分)生成故障診斷預(yù)警數(shù)據(jù)近3萬條,準(zhǔn)確率約為80%,預(yù)報(bào)了動(dòng)車組聯(lián)軸節(jié)脫開、軸箱軸承故障、蓄電池?zé)龘p等典型故障,有效保障了動(dòng)車組運(yùn)行安全;針對(duì)動(dòng)車組的散熱裝置進(jìn)行健康度預(yù)測(cè),動(dòng)車組濾棉更換次數(shù)、散熱裝置清潔沖洗次數(shù)顯著下降,降低了維修成本。
現(xiàn)階段的動(dòng)車組PHM系統(tǒng)運(yùn)維算法模型尚存在如下問題:(1)模型設(shè)計(jì)依賴于專家經(jīng)驗(yàn),具有主觀性[3-4];(2)模型主要基于動(dòng)車組系統(tǒng)運(yùn)行機(jī)理構(gòu)建,對(duì)較復(fù)雜的部件故障難以進(jìn)行有效預(yù)測(cè);(3)利用傳統(tǒng)故障診斷方法難以構(gòu)建動(dòng)車組部件“健康”與“非健康”的狀態(tài)分界面,不利于健康管理的深化;(4)利用監(jiān)督學(xué)習(xí)構(gòu)建算法需要高質(zhì)量的數(shù)據(jù)標(biāo)注,但動(dòng)車組關(guān)鍵部件的故障標(biāo)注數(shù)據(jù)尚在積累階段,健康度標(biāo)注則還在研究中。
為深化發(fā)展高鐵動(dòng)車組智能運(yùn)維算法,亟需在基于人工智能(AI ,Artificial Intelligence)的高鐵動(dòng)車組智能運(yùn)維算法研究平臺(tái)中構(gòu)建數(shù)據(jù)分析系統(tǒng),將AI算法引入特征工程和數(shù)據(jù)標(biāo)注環(huán)節(jié),利用AI算法打通高鐵動(dòng)車組智能運(yùn)維算法研究的全過程。
高鐵動(dòng)車組智能運(yùn)維算法研究平臺(tái)包括數(shù)據(jù)分析系統(tǒng)和建模分析系統(tǒng),如圖1所示。動(dòng)車組PHM系統(tǒng)將動(dòng)車組車載信息無線傳輸系統(tǒng)(WTDS ,Wireless Transmission Device System)數(shù)據(jù)存入離線數(shù)據(jù)倉庫,作為平臺(tái)的數(shù)據(jù)支撐,數(shù)據(jù)接入平臺(tái)后,經(jīng)過數(shù)據(jù)處理、特征工程、數(shù)據(jù)標(biāo)注、模型訓(xùn)練和模型驗(yàn)證等步驟,反復(fù)迭代、優(yōu)化形成穩(wěn)定可靠的模型,最終部署至動(dòng)車組PHM系統(tǒng)。
圖 1 高鐵動(dòng)車組智能運(yùn)維算法研究平臺(tái)總體架構(gòu)
下載: 全尺寸圖片 幻燈片
數(shù)據(jù)分析系統(tǒng)負(fù)責(zé)進(jìn)行數(shù)據(jù)處理、特征工程和數(shù)據(jù)標(biāo)注,包括數(shù)據(jù)管理、數(shù)據(jù)處理、特征管理和數(shù)據(jù)標(biāo)注功能模塊;建模分析系統(tǒng)負(fù)責(zé)進(jìn)行模型訓(xùn)練和模型驗(yàn)證[5-6],包括算法管理、任務(wù)管理、模型管理和成果管理功能模塊。數(shù)據(jù)分析系統(tǒng)作為建模分析系統(tǒng)的前置環(huán)節(jié),可為建模分析系統(tǒng)作好特征工程與數(shù)據(jù)標(biāo)注準(zhǔn)備。
動(dòng)車組部件的數(shù)據(jù)海量而繁雜,在現(xiàn)階段數(shù)據(jù)標(biāo)注較為匱乏的情況下,難以進(jìn)行高效的算法探索與模型分析,針對(duì)此問題,數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)了具體的處理流程,如圖2所示。系統(tǒng)的特征工程部分細(xì)分為降維聚類和結(jié)果分析2個(gè)流程。降維聚類后的結(jié)果需經(jīng)專業(yè)人員分析確認(rèn)后才能作為特征工程環(huán)節(jié)的輸出。數(shù)據(jù)特征數(shù)量較多時(shí),高維度數(shù)據(jù)樣本在空間的分布呈現(xiàn)稀疏性,難以進(jìn)行進(jìn)一步分析,在數(shù)據(jù)處理中被稱為“維數(shù)災(zāi)難”[7],降維是解決維數(shù)災(zāi)難的重要方法,降維的目的是在壓縮數(shù)據(jù)的同時(shí)讓信息損失最小化。在降維的基礎(chǔ)上,聚類算法可顯著降低數(shù)據(jù)分析的復(fù)雜性,提高聚類結(jié)果的可解釋性。經(jīng)“降維—聚類”后的數(shù)據(jù)可更加直觀地反映數(shù)據(jù)間的潛在關(guān)系,有助于后續(xù)的數(shù)據(jù)標(biāo)注和建模分析。
圖 2 數(shù)據(jù)分析系統(tǒng)的處理流程
下載: 全尺寸圖片 幻燈片
主成分分析(PCA ,Principal Component Analysis)是一種經(jīng)典的線性降維方法[8]。PCA的主要思想是將高維數(shù)據(jù)通過線性變換投影到低維空間中,并期望在所投影維度上數(shù)據(jù)的信息量最大(方差最大)。
t-分布隨機(jī)鄰域嵌入(t-SNE ,t-distributed Stochastic Neighbor Embedding)是一種非線性降維算法[9]。該算法的基本思想是保持樣本點(diǎn)在高維空間和低維空間中的概率分布盡量相似,以達(dá)到降維的目的。
均勻流形逼近和投影(UMAP ,Uniform Manifold Approximation and Projection)是一種基于黎曼幾何和代數(shù)拓?fù)淅碚摽蚣軜?gòu)建的非線性流形學(xué)習(xí)算法[10]。UMAP依據(jù)高維空間映射到低維空間相似度的定性結(jié)論,將高維數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)進(jìn)行低維映射以達(dá)到降維結(jié)果,主要包含構(gòu)造1個(gè)特殊的加權(quán)K鄰域圖和計(jì)算該圖低維表示2個(gè)階段。
K-means算法是一種劃分聚類算法。給定一個(gè)數(shù)據(jù)點(diǎn)集合和需要的聚類數(shù)目K,該算法根據(jù)距離函數(shù)反復(fù)把數(shù)據(jù)分入K個(gè)聚類中。
Louvain算法[11]是一種基于圖數(shù)據(jù)的社區(qū)發(fā)現(xiàn)算法,優(yōu)化目標(biāo)為最大化整個(gè)數(shù)據(jù)的模塊度,模塊度的計(jì)算公式為
Q=12m∑ij[Ai,j?kikj2m]δ(Ci,Cj)Q=12m∑ij[Ai,j?kikj2m]δ(Ci,Cj) |
其中,mm為圖中邊的總數(shù)量;ki、kjki、kj分別表示所有指向節(jié)點(diǎn)ii、j的連邊權(quán)重之和;Ai,jAi,j表示節(jié)點(diǎn)i、j之間的連邊權(quán)重,CiCi表示節(jié)點(diǎn)i所屬的社區(qū),當(dāng)Ci=CjCi=Cj時(shí),δ(Ci,Cj)=1δ(Ci,Cj)=1,否則δ(Ci,Cj)=0δ(Ci,Cj)=0。通過QQ值可確定社區(qū)的分類度,其取值范圍為[0,1][0,1],Q值越大,分類度越好。
變分自編碼器(VAE ,Variational Auto-Encoder)是自編碼器(AE,Auto Encoder)在生成模型上的變體?;谏疃葘W(xué)習(xí)的聚類模型選用不同的神經(jīng)網(wǎng)絡(luò)提升聚類效果,AE、VAE、生成式對(duì)抗網(wǎng)絡(luò)(GAN ,Generative Adversarial Networks)用于聚類的原理類似。
VAE要求AE的中間特征服從給定的高斯分布,通過變分推斷法推斷出樣本概率的最大下界,最大化下界的過程會(huì)使樣本的中間特征逼近給定的先驗(yàn)分布。
故障的發(fā)生具有突發(fā)性和隱蔽性,故障診斷和預(yù)測(cè)有較大難度。本文采用“PCA+Louvain+UMAP”的降維聚類算法,以高鐵動(dòng)車組客室空調(diào)的數(shù)據(jù)分析為例,說明高鐵動(dòng)車組智能運(yùn)維數(shù)據(jù)分析系統(tǒng)的應(yīng)用。高鐵動(dòng)車組客室空調(diào)故障是動(dòng)車組夏季常見的故障之一,動(dòng)車組在運(yùn)行過程中車體呈全密閉式,當(dāng)空調(diào)制冷系統(tǒng)發(fā)生故障時(shí),車內(nèi)室溫不斷升高,將影響車內(nèi)乘客的乘車環(huán)境,甚至可能導(dǎo)致動(dòng)車組無法繼續(xù)運(yùn)行,嚴(yán)重影響動(dòng)車組運(yùn)行秩序[3]。
本文選取動(dòng)車組客室空調(diào)相關(guān)部件傳感器數(shù)據(jù)用于分析其健康狀況的特征,數(shù)據(jù)來源為20列CRH380B型和20列CRH380BL型動(dòng)車組在2020年6月~8月運(yùn)行期間的客室空調(diào)相關(guān)WTDS數(shù)據(jù),共4725120條記錄,每條記錄的10維特征選取如表1所示。
表 1 客室空調(diào)特征列表
序號(hào) | 特征 | 序號(hào) | 特征 | |
1 | 客室溫度 | 6 | 壓縮機(jī)1高壓值 | |
2 | 客室空調(diào)送風(fēng)溫度 | 7 | 壓縮機(jī)1低壓值 | |
3 | 室外溫度 | 8 | 壓縮機(jī)2高壓值 | |
4 | 車速 | 9 | 壓縮機(jī)2低壓值 | |
5 | 客室空調(diào)模式 | 10 | 客室空調(diào)通風(fēng)狀態(tài) |
下載: 導(dǎo)出CSV | 顯示表格
本文對(duì)選取的10維特征進(jìn)行缺失值處理、去量綱等數(shù)據(jù)預(yù)處理,并結(jié)合業(yè)務(wù)知識(shí)和經(jīng)驗(yàn)[12]對(duì)其進(jìn)行特征擴(kuò)展,新的特征與客室空調(diào)故障有更好的相關(guān)性,有助于進(jìn)行數(shù)據(jù)分析。最終將特征從10維擴(kuò)展至16維,擴(kuò)展后的特征如表2所示。
表 2 擴(kuò)展后的客室空調(diào)特征列表
序號(hào) | 特征 | 序號(hào) | 特征 | |
1 | 客室溫度 | 10 | 客室空調(diào)通風(fēng)狀態(tài) | |
2 | 客室空調(diào)送風(fēng)溫度 | 11 | 客室溫度移動(dòng)平均值MA5 | |
3 | 室外溫度 | 12 | 客室溫度相鄰數(shù)據(jù)差值 | |
4 | 車速 | 13 | 室外溫度移動(dòng)平均MA5 | |
5 | 客室空調(diào)模式 | 14 | 車速移動(dòng)平均值MA5 | |
6-9 | 壓縮機(jī)高低壓 | 15-16 | 壓縮機(jī)高低壓差 |
下載: 導(dǎo)出CSV | 顯示表格
(1)降維:對(duì)擴(kuò)展后的16維特征數(shù)據(jù),利用PCA方法進(jìn)行線性降維,降維結(jié)果如圖3所示,橫坐標(biāo)代表主成分的序號(hào),縱坐標(biāo)代表主成分對(duì)應(yīng)的標(biāo)準(zhǔn)差。由圖3可知,大部分信息在前9個(gè)主成分中捕獲,因此,選擇前9個(gè)主成分進(jìn)行后續(xù)分析。
圖 3 PCA降維的成分分析
下載: 全尺寸圖片 幻燈片
(2)聚類:選擇降維后數(shù)據(jù)的前9個(gè)主成分作為輸入,利用Louvain算法進(jìn)行基于圖的聚類,其中resolution參數(shù)為0.5。
(3)可視化:對(duì)于聚類后的數(shù)據(jù)進(jìn)行UMAP降維,在2維空間上進(jìn)行可視化展示,如圖4所示,以供專業(yè)人員進(jìn)行結(jié)果分析。
圖 4 動(dòng)車組客室空調(diào)健康狀況降維聚類結(jié)果
下載: 全尺寸圖片 幻燈片
對(duì)16維特征數(shù)據(jù)進(jìn)行“PCA+Louvain+UMAP”降維聚類分析的結(jié)果如圖4所示,數(shù)據(jù)被聚類為12個(gè)類別,不同的顏色代表不同的類別。專業(yè)人員通過對(duì)結(jié)果的分析發(fā)現(xiàn),可將圖中的12個(gè)類別劃分為4類區(qū)域A、B、C和D,各類數(shù)據(jù)的主要特征如表3所示。
表 3 各類數(shù)據(jù)對(duì)應(yīng)的主導(dǎo)特征列表
類別 | 主導(dǎo)特征 |
A | 室溫連續(xù)5 min ≥ 28.5℃或 |
B | 30 min內(nèi)出現(xiàn)1次連續(xù)5 min內(nèi)前后室溫?cái)?shù)據(jù)差值 |
C | 30 min內(nèi)出現(xiàn)1次連續(xù)5 min內(nèi)相鄰室溫?cái)?shù)據(jù)差值 ≥ 1.5℃ |
D | 其他 |
下載: 導(dǎo)出CSV | 顯示表格
A類數(shù)據(jù)為一級(jí)故障預(yù)警;B類數(shù)據(jù)為二級(jí)故障預(yù)警;C類數(shù)據(jù)為三級(jí)故障預(yù)警;D類數(shù)據(jù)為客室空調(diào)健康狀態(tài)下的數(shù)據(jù),可被分類為正常[12]。
根據(jù)圖4的聚類效果和結(jié)果分析,發(fā)現(xiàn)動(dòng)車組客室空調(diào)健康狀況是可劃分的,并且劃分后的4類區(qū)域可反映不同程度的客室空調(diào)健康狀況,說明16維特征的選取是合理的,可作為特征工程環(huán)節(jié)的輸出。在建模分析階段可將這16維特征作為特征池,形成客室空調(diào)健康度判定算法。同時(shí),可將A、B、C、D這4種分類的聚類結(jié)果轉(zhuǎn)換為客室空調(diào)健康度的數(shù)據(jù)標(biāo)簽。標(biāo)注后的數(shù)據(jù)作為模型分析系統(tǒng)的輸入,利用監(jiān)督學(xué)習(xí)的方法,形成客室空調(diào)故障診斷和預(yù)測(cè)方法。
本文概述了高鐵動(dòng)車組智能運(yùn)維算法研究平臺(tái)的總體架構(gòu),著重闡述了高鐵動(dòng)車組智能運(yùn)維數(shù)據(jù)分析系統(tǒng)的構(gòu)建,包括關(guān)鍵算法和數(shù)據(jù)處理流程。并以高鐵動(dòng)車組客室空調(diào)故障的數(shù)據(jù)分析為例進(jìn)行了應(yīng)用研究與分析,證明了該系統(tǒng)的可用性。
下一步應(yīng)進(jìn)行的工作包括:(1)利用“降維—聚類”的算法框架完成塞拉門、軸承類等部件的特征工程和數(shù)據(jù)標(biāo)注;(2)利用特征工程和數(shù)據(jù)標(biāo)注的結(jié)果,建立有監(jiān)督的客室空調(diào)健康評(píng)估模型,實(shí)現(xiàn)客室空調(diào)故障診斷和預(yù)測(cè)。
聯(lián)系客服