2019年7月22-23日,由工業(yè)和信息化部指導(dǎo),中國(guó)信息通信研究院主辦的第三屆“中國(guó)工業(yè)大數(shù)據(jù)創(chuàng)新競(jìng)賽”(以下簡(jiǎn)稱為“競(jìng)賽”)決賽現(xiàn)場(chǎng)答辯及頒獎(jiǎng)儀式在北京遼寧大廈落下帷幕。作為首個(gè)由政府主管部門(mén)指導(dǎo)的工業(yè)大數(shù)據(jù)領(lǐng)域的權(quán)威性全國(guó)賽事,競(jìng)賽已累計(jì)吸引產(chǎn)學(xué)研各界超過(guò)6000人參賽,開(kāi)發(fā)出許多聚焦行業(yè)細(xì)分領(lǐng)域的算法模型,解決諸多傳統(tǒng)工業(yè)領(lǐng)域中的“老大難”問(wèn)題。此次,InfoQ 專訪第三屆工業(yè)大數(shù)據(jù)競(jìng)賽冠軍團(tuán)隊(duì)胡翔,以及來(lái)自首爾大學(xué)的國(guó)際團(tuán)隊(duì) tea ,深入解讀在工業(yè)大數(shù)據(jù)與智能制造領(lǐng)域中這群開(kāi)拓者的故事。
我并不是“一個(gè)人在戰(zhàn)斗”
作為決賽中唯一的個(gè)人參賽者,當(dāng)提起“以一敵百”取得冠軍的榮耀時(shí)刻時(shí),胡翔調(diào)侃道,“實(shí)際上我并不是‘一個(gè)人在戰(zhàn)斗’?!?/p>
面對(duì)著競(jìng)賽數(shù)十只支多人隊(duì)伍同場(chǎng)競(jìng)技,胡翔表示單人參賽既有優(yōu)勢(shì)又有劣勢(shì)。其中,優(yōu)勢(shì)在于個(gè)人對(duì)比賽工作的安排更加自由靈活,同時(shí)也會(huì)更加專注,對(duì)于每一個(gè)想法都能親自嘗試與驗(yàn)證,這使得自己對(duì)問(wèn)題的理解能更加的透徹、深入。
但是,“人多力量大”這句老話也確有道理,單人參賽相比于多人團(tuán)隊(duì),需要去做更多的分析工作,也更加有壓力。畢竟個(gè)人的理解能力比較單一,缺乏不同思路的碰撞,思路會(huì)更容易陷入壁壘?!暗苄疫\(yùn)的是在因聯(lián)科技,我身邊的同事給了我很多幫助,他們對(duì)這個(gè)問(wèn)題的理解和思路給了我很多啟發(fā),實(shí)際上我并不是‘一個(gè)人在戰(zhàn)斗’,在這里向他們表示感謝?!?/p>
2018 年,胡翔碩士畢業(yè)于西安交通大學(xué)機(jī)械工程學(xué)院,入職于西安因聯(lián)信息科技,正式成為了一名工業(yè)算法工程師。持續(xù)關(guān)注工業(yè)大數(shù)據(jù)相關(guān)信息的他,在看到第三屆工業(yè)大數(shù)據(jù)競(jìng)賽報(bào)名的信息后,毅然決定“單槍匹馬大練兵”。
對(duì)于“練兵”的含義,胡翔笑著說(shuō):“練兵有兩層含義,一是為了鍛煉自己解決工業(yè)預(yù)測(cè)性維護(hù)問(wèn)題的能力。二是在工業(yè)預(yù)測(cè)性維護(hù)領(lǐng)域工作一年多后,以比賽這種形式去解決實(shí)際問(wèn)題,對(duì)于自我業(yè)務(wù)能力的提升,是一個(gè)非常好的機(jī)會(huì)。畢竟比賽的水平是非常高的,還能認(rèn)識(shí)非常多優(yōu)秀的同行?!?/p>
第三屆工業(yè)大數(shù)據(jù)創(chuàng)新競(jìng)賽冠軍 胡 翔
合適的解題思路是解決問(wèn)題的“靈魂”所在
工業(yè)大數(shù)據(jù)創(chuàng)新競(jìng)賽自 2017 年首屆舉辦以來(lái),每一屆競(jìng)賽都為參賽者提供著基于真實(shí)工業(yè)場(chǎng)景的數(shù)據(jù)資源,并為工業(yè)大數(shù)據(jù)領(lǐng)域的相關(guān)研究人員和創(chuàng)業(yè)者們提供了成果轉(zhuǎn)移轉(zhuǎn)化的交流平臺(tái)。
“實(shí)際上本次競(jìng)賽的數(shù)據(jù),均來(lái)源于沈鼓大型高速旋轉(zhuǎn)機(jī)組實(shí)際運(yùn)行中的真實(shí)數(shù)據(jù),故障案例非常寶貴,”胡翔對(duì)記者說(shuō)道。據(jù)了解,胡翔的工作主要集中在振動(dòng)速度和加速度數(shù)據(jù)的分析上,之前從未獲取過(guò)這么大量的大機(jī)組振動(dòng)位移數(shù)據(jù)進(jìn)行分析,當(dāng)記者詢問(wèn)胡翔拿到賽題與數(shù)據(jù)后的第一反映,胡翔表示“十分驚喜”。
早在 2019 大數(shù)據(jù)產(chǎn)業(yè)峰會(huì),中國(guó)通信研究院就發(fā)布了首道主賽區(qū)賽題——由沈陽(yáng)鼓風(fēng)機(jī)集團(tuán)測(cè)控技術(shù)有限公司提供的《大型旋轉(zhuǎn)機(jī)組轉(zhuǎn)子部件脫落故障預(yù)測(cè)》。但看到賽題后的胡翔,并未著急著手“解題”,而是先確定了一個(gè)合適的解題思路后,再進(jìn)行攻克。
“我個(gè)人認(rèn)為解題思路實(shí)際是解決問(wèn)題的“靈魂”所在。不論是在這次的比賽中還是日常工作中,所有問(wèn)題的解決都是依賴于正確的解題思路。”胡翔總結(jié)道,只有在深入理解賽題目標(biāo)和數(shù)據(jù)的基礎(chǔ)上,才能確定一個(gè)合適的解題思路,合適的解題思路會(huì)對(duì)數(shù)據(jù)分析和特征提取提供非常好的方向。
比如對(duì)于工業(yè)領(lǐng)域的數(shù)據(jù)挖掘比賽,很多選手一開(kāi)始就確立的是純數(shù)據(jù)的分析和挖掘,很少結(jié)合機(jī)理分析,僅僅是提取了數(shù)據(jù)各個(gè)統(tǒng)計(jì)特征,并且使用了多個(gè)模型對(duì)結(jié)果進(jìn)行融合。雖然這也許能得到非常好的結(jié)果,但這種模型并沒(méi)有“洞察力”,首先特征對(duì)于模型結(jié)果的解釋力并不強(qiáng),其次這種模型很難與人建立信任,最終雖然訓(xùn)練出一個(gè)準(zhǔn)確率為 99% 的模型,但卻難以成功在工業(yè)實(shí)際場(chǎng)景中落地實(shí)踐。
打破專家定論——新方法解決老問(wèn)題
本次競(jìng)賽賽題《大型旋轉(zhuǎn)機(jī)組轉(zhuǎn)子部件脫落故障預(yù)測(cè)》屬于工業(yè)領(lǐng)域典型的異常檢測(cè)和故障診斷問(wèn)題。旋轉(zhuǎn)類機(jī)械設(shè)備的故障診斷問(wèn)題在實(shí)際的工業(yè)場(chǎng)景中非常常見(jiàn),轉(zhuǎn)子部件脫落更是一個(gè)老問(wèn)題。
據(jù)了解,比賽數(shù)據(jù)提供方沈鼓負(fù)責(zé)人曾在阿爾斯通的時(shí)候就遇到過(guò)這個(gè)問(wèn)題,并就該問(wèn)題與歐美專家進(jìn)行討論,當(dāng)時(shí)的結(jié)論是不可能通過(guò)傳感器的信號(hào)預(yù)測(cè)出故障。但讓人驚喜的是,在比賽中非常多優(yōu)秀的選手和解決方案,用不同的方法實(shí)現(xiàn)轉(zhuǎn)子部件脫落的故障預(yù)測(cè),打破了當(dāng)時(shí)專家的定論。其中最讓在場(chǎng)專家評(píng)審印象深刻的要屬冠軍團(tuán)隊(duì)胡翔的解決方案。
要說(shuō)胡翔的解決方案,重中之重就是在拿到賽題數(shù)據(jù)后,對(duì)原始工業(yè)數(shù)據(jù)進(jìn)行了包括數(shù)據(jù)的整合和數(shù)據(jù)的可視化的預(yù)處理。由于工業(yè)數(shù)據(jù)的復(fù)雜性,數(shù)據(jù)集存在數(shù)據(jù)測(cè)點(diǎn)名稱與測(cè)點(diǎn)數(shù)據(jù)不一致的問(wèn)題,所以第一步他先對(duì)數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化整理,將測(cè)點(diǎn)名稱標(biāo)準(zhǔn)化;第二步是對(duì)振動(dòng)位移數(shù)據(jù)進(jìn)行可視化分析,考慮到大機(jī)組的振動(dòng)采樣特性,以及典型的位移振動(dòng)分析方法特點(diǎn),通過(guò)總采樣點(diǎn)與轉(zhuǎn)子旋轉(zhuǎn)周數(shù)相除,得到了采樣頻率為每轉(zhuǎn) 32 點(diǎn)(等角度采樣)。
在獲取采樣頻率后,利用 FFT 變換獲取位移振動(dòng)階次譜,并觀察故障樣本和正常樣本階次譜的區(qū)別差異,為特征提取提供方向。競(jìng)賽中,胡翔在階次譜中提取了 1 倍轉(zhuǎn)頻,2 倍轉(zhuǎn)頻,3 倍轉(zhuǎn)頻等特征,并觀察這些特征在有故障機(jī)組和無(wú)故障機(jī)組中歷史趨勢(shì),進(jìn)而選擇有效特征。同時(shí)根據(jù)轉(zhuǎn)子 X 向和 Y 向位移,合成軸心軌跡,發(fā)現(xiàn)無(wú)故障機(jī)組的軸心軌跡在各個(gè)時(shí)段變幾乎沒(méi)有較大變化(如圖 1),而轉(zhuǎn)子部件脫落故障的機(jī)組的軸心軌跡在各個(gè)時(shí)段經(jīng)歷較大變化(如圖 2)。
圖 1 無(wú)故障機(jī)組各時(shí)段典型軸心軌跡
圖 2 故障機(jī)組各時(shí)段典型軸心軌跡
此后,胡翔別出心裁地把賽題拆解為“轉(zhuǎn)子部件是否脫落”與“脫落故障征兆強(qiáng)度識(shí)別”兩個(gè)部分,并通過(guò)解決二分類問(wèn)題與分類概率大小排序問(wèn)題,分別解決賽題的兩大難點(diǎn)。
其中,解決二分類問(wèn)題所面臨的挑戰(zhàn)在于數(shù)據(jù)集的劃分,如何選取訓(xùn)練數(shù)據(jù)集,對(duì)結(jié)果的影響非常之大。由于理論上轉(zhuǎn)子部件脫落故障征兆在最接近故障發(fā)生時(shí)刻表現(xiàn)最強(qiáng),最接近故障時(shí)間的數(shù)據(jù)與實(shí)際故障數(shù)據(jù)也是最相似的,所以胡翔在解題中選取了最接近故障時(shí)間的數(shù)據(jù)作為二分類的正例數(shù)據(jù)進(jìn)行訓(xùn)練。
在分類概率大小排序問(wèn)題中,最大的挑戰(zhàn)莫過(guò)于如何篩選特征,因?yàn)樘卣鬟x擇關(guān)系到模型的性能結(jié)果和泛化能力??紤]到賽題目標(biāo)是區(qū)分故障征兆強(qiáng)度,對(duì)于機(jī)械部件故障來(lái)說(shuō),越接近故障發(fā)生時(shí)刻,征兆的表現(xiàn)也就越強(qiáng),因此特征若是與故障時(shí)間呈現(xiàn)較強(qiáng)的單調(diào)性,它能區(qū)分故障的能力也就越強(qiáng),也越能區(qū)分故障處于哪個(gè)階段。綜合上述分析,選擇故障數(shù)據(jù)中單調(diào)性更強(qiáng)的特征進(jìn)行建模和預(yù)測(cè)為最佳解決方案。最終都取得了比較好的結(jié)果,胡翔的這些思路和方案在答辯中也得到了多位評(píng)委的認(rèn)可和贊許。
但胡翔也表示他的算法模型還有一些不足需要改進(jìn)與完善,算法模型的精度上還需要提升,以滿足工業(yè)應(yīng)用的更高要求。算法模型也需要考慮除“轉(zhuǎn)子部件脫落故障”之外的其余故障對(duì)算法模型的影響,只有解決了這個(gè)關(guān)鍵問(wèn)題,算法模型才有可能在工業(yè)實(shí)際中得到應(yīng)用。
全球參賽選手同臺(tái)競(jìng)技,各領(lǐng)風(fēng)騷
第三屆工業(yè)大數(shù)據(jù)創(chuàng)新競(jìng)賽已順利落下帷幕。但值得注意的是,本屆競(jìng)賽可謂是一場(chǎng)真正意義上的全球競(jìng)技,中國(guó)信息通信研究院作為全球工業(yè)大數(shù)據(jù)領(lǐng)域頂尖活動(dòng)—— PHM 亞太學(xué)術(shù)論壇(www.phmap.cn)主辦方之一,賽題也有全球參賽選手和國(guó)內(nèi)參賽者同臺(tái) PK,而來(lái)自首爾大學(xué)的參賽團(tuán)隊(duì)“ tea ”更是取得了第三名的好成績(jī)。
tea 小組是由來(lái)自首爾國(guó)立大學(xué)機(jī)械工程系的研究生 Yongjin Shin、Jongmin Park 與 Myungyon Kim 共同組成。在接受記者采訪時(shí),tea 小組的成員們談起這段參賽經(jīng)歷時(shí),感嘆道:"Since we are students in the lab, we often use experimental data or refined data. However, it was a good experience to analyze and build the model by directly using the data measured in the industrial field without any filtering. (由于我們是實(shí)驗(yàn)室的學(xué)生,使用到的通常為實(shí)驗(yàn)數(shù)據(jù)或處理后的數(shù)據(jù)。直接使用工業(yè)領(lǐng)域中測(cè)量的未經(jīng)處理的數(shù)據(jù)來(lái)分析和建模是一段很好的經(jīng)歷。)"
第三屆工業(yè)大數(shù)據(jù)創(chuàng)新競(jìng)賽韓國(guó)參賽團(tuán)隊(duì) tea 小組
據(jù)了解,這也是 tea 小組第一次來(lái)中國(guó)參加此類比賽。對(duì)于他們來(lái)說(shuō),本次競(jìng)賽的最大挑戰(zhàn)在于,給定的數(shù)據(jù)集是在轉(zhuǎn)子部件脫落故障之前采集的。因此,在分析數(shù)據(jù)的過(guò)程中,很難檢測(cè)到故障發(fā)生的特征,并確定未故障到接近故障的順序。而為了更清晰的判斷,tea 小組在解題初期也想過(guò)使用機(jī)器學(xué)習(xí)或其他模型(實(shí)際上一些成員的主要研究方向是 PHM 領(lǐng)域的深度學(xué)習(xí)),但由于標(biāo)簽信息可能會(huì)由于上訴問(wèn)題變得不清晰,tea 小組設(shè)定了自己的標(biāo)準(zhǔn),以確定是否故障及故障的順序。
同樣,為了實(shí)現(xiàn)在實(shí)際工業(yè)場(chǎng)景中的應(yīng)用,tea 小組表示,他們還需對(duì)給定目標(biāo)系統(tǒng)(的特定故障)設(shè)置更合適的故障標(biāo)準(zhǔn)或閾值,算法模型也要從目標(biāo)系統(tǒng)中同時(shí)獲取正常和故障的數(shù)據(jù),并設(shè)置明確標(biāo)準(zhǔn)以區(qū)分是正常還是故障,實(shí)現(xiàn)模型的進(jìn)一步優(yōu)化與改進(jìn)。
近年來(lái),在工業(yè) 4.0 的發(fā)展趨勢(shì)下,韓國(guó)和中國(guó)一樣,隨著高附加值技術(shù)重要性的增強(qiáng),過(guò)程自動(dòng)化以及相關(guān)的自動(dòng)故障診斷和預(yù)測(cè)系統(tǒng)也將變得十分重要。
寫(xiě)在最后
智能制造和工業(yè)互聯(lián)網(wǎng)是密不可分的關(guān)系。正如胡翔所說(shuō),預(yù)測(cè)性維護(hù)是工業(yè)互聯(lián)網(wǎng)應(yīng)用的“皇冠上的明珠”。當(dāng)然遠(yuǎn)遠(yuǎn)不止如此,大數(shù)據(jù)和智能制造給傳統(tǒng)工業(yè)帶來(lái)了巨大沖擊,強(qiáng)大的工業(yè)數(shù)據(jù)分析服務(wù)將成為制造企業(yè)數(shù)字化戰(zhàn)略的重要組成部分,工業(yè)互聯(lián)網(wǎng)將顯現(xiàn)出更大的戰(zhàn)略價(jià)值。可以預(yù)見(jiàn),工業(yè)大數(shù)據(jù)應(yīng)用將帶來(lái)工業(yè)企業(yè)創(chuàng)新和變革的新時(shí)代。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 為什么年輕人不愛(ài)換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個(gè)月發(fā)不出工資
- 柔宇科技被曝已6個(gè)月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動(dòng)未來(lái)”環(huán)保公益圖書(shū)館落地貴州山區(qū)小學(xué)
- 窺見(jiàn)“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場(chǎng)定位清晰,攜手共進(jìn),核心技術(shù)決定未來(lái)
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。