挑戰(zhàn)-40℃-70℃,邊緣計算設備再次突破極限值

計算是智慧時代一個永恒的話題。那邊廂云計算已是熱火朝天,這邊廂邊緣計算已呈燎原之勢。

有人形容,邊緣計算是“人工智能的最后一公里”,“物聯(lián)網(wǎng)的最后一公里”,“打通用戶的最后一公里”……邊緣計算看似不起眼,卻將承載起邊緣側海量的數(shù)據(jù)計算處理。但“最后一公里”恰恰是最為艱難的一公里,需求的多樣化和差異化,讓邊緣計算產業(yè)化受到一定程度的制約,落地略顯尷尬。

如何打破這種局面,讓邊緣計算不再“邊緣”,在更多業(yè)務場景中加速走向落地?來自浪潮信息的一群人,他們并沒有選擇坐而論道和紙上談兵,而是深入到海南太陽暴曬的路口、東北寒冷偏僻的油井現(xiàn)場、西北大山深處的煤礦等地進行多方位需求調研,堅定地提出邊緣服務器-40℃-70℃環(huán)境極限值挑戰(zhàn),并且創(chuàng)新性地發(fā)明了三明治散熱架構,大幅提升邊緣計算設備適用性。

這些實踐無疑證明當前邊緣計算落地關鍵所在:即邊緣計算產品的研發(fā)與邊緣場景需求必須深入對接,既需要雙手沾泥般深入業(yè)務場景去了解真實需求,又能在產品研發(fā)上打破常規(guī)進行大膽創(chuàng)新,只有這樣方能真正引領邊緣計算走向落地。

上山下海,才敢提挑戰(zhàn)-40℃-70℃極限

如今,在5G、大數(shù)據(jù)、AI、物聯(lián)網(wǎng)等技術的驅動下,邊緣場景在各大行業(yè)中迅速興起。Gartner預測,到2025年將有30%的數(shù)據(jù)會運行在邊緣,邊緣場景將會成為數(shù)據(jù)產生、智能應用的主陣地之一。

與數(shù)據(jù)中心等相對穩(wěn)定的環(huán)境和專業(yè)的運維團隊不同,邊緣場景的環(huán)境可謂是千差萬別,更沒有專業(yè)團隊負責日常的運維與管理,這就讓邊緣設備的研發(fā)遇到兩大挑戰(zhàn):

其一,溫度、濕度、粉塵等環(huán)境因行業(yè)而異,不同行業(yè)的需求復雜多樣,對于邊緣設備的適應性提出極高挑戰(zhàn);

其二,邊緣場景尚未成熟,有著巨大的需求空間尚待探索,用戶需求也不明確,廠商沒有標準來參考開發(fā)邊緣設備與方案。

“一切都需要以用戶為中心,去真實場景中探索詳細需求。例如,在室外一些智慧交通路口、智慧電網(wǎng)智能運維等場景中,用戶對于設備的環(huán)境適應性、運行穩(wěn)定性要求很高。”浪潮信息邊緣計算產品線高級產品經(jīng)理劉香男介紹道。

事實上,針對邊緣計算設備部署環(huán)境這個最大的挑戰(zhàn),浪潮信息的產品團隊大膽提出了“-40℃-70℃”的部署環(huán)境溫度極限值。做出這個決定,產品團隊并不是拍腦門和想當然。從2020年浪潮信息成立專門的邊緣計算事業(yè)部起,產品團隊在兩年時間里進行了大量的用戶走訪與需求調研,并總結得出“-40℃-70℃”溫度極限值的產品研發(fā)需求。

但這卻給產品研發(fā)團隊提出了一個極大挑戰(zhàn)。眾所周知,由于環(huán)境的限制,邊緣計算設備通常采用無風扇的設計,對于邊緣設備的散熱是極大考驗,遠超市面其他產品的“-40℃-70℃”極限值需求著實讓研發(fā)團隊大吃一驚。

“當時拿到產品團隊的需求第一感覺是太難了?!崩顺毙畔⑦吘売嬎惝a品線高級硬件架構師付長昭如是說,“一開始甚至一些抵觸。因為接觸過一些包括霧計算、小型通信類設備,也了解這些行業(yè)的規(guī)范與標準,很少有規(guī)范和標準會把無風散熱的極限值設定在70℃,覺得產品經(jīng)理提的需求根本實現(xiàn)不了?!?/p>

在產品與研發(fā)不斷溝通之后,產品團隊覺得有必要讓研發(fā)理解“-40℃~70℃”極限值需求是真實存在且極其有必要。于是,產品團隊和研發(fā)團隊一起親自體驗了真實的邊緣場景。

“到了道路口的一個信控箱,打開一看,真是大開眼界,能想到的和想不到的全有,環(huán)境之復雜超乎想象?!备堕L昭回憶道,“此刻,我終于明白產品團隊所提需求絕非虛言,邊緣計算要想獲得有效地應用,必須克服這個難題。”

確認好需求之后,擺在研發(fā)團隊面前的難題就是:如何實現(xiàn)“-40℃-70℃”的極限值。由于并無先例,研發(fā)團隊一時并無頭緒,正當研發(fā)團隊陷入苦惱、壓力山大時,一塊三明治的出現(xiàn),徹底“拯救”了研發(fā)小伙伴們。

一塊三明治帶來的啟發(fā)

眾所周知,散熱是邊緣計算設備穩(wěn)定運行的關鍵因素和最大難點。

這是因為如今的邊緣計算設備早已不是簡單的執(zhí)行控制程序,還需要進行大量的數(shù)據(jù)流處理、AI模型推理等,對于算力的需求大幅提升,也讓CPU的運行往往處于較為飽和的狀態(tài),CPU一旦高速運轉,溫度最高可達90℃,加上像交通信號柜等邊緣場景往往是封閉的鐵皮箱,環(huán)境溫度在夏天往往達到60~70℃,讓邊緣計算設備的散熱更加困難。

“前期我們主要是確定研發(fā)方向:在散熱上蓋和熱源之間增加高導熱系數(shù)的導熱材料,讓熱量快速傳遞出去?!备堕L昭介紹道,“但嘗試了很多次,連60℃的散熱極限的都無法滿足?!?/p>

研發(fā)項目進度陷入停滯,研發(fā)團隊甚至一度動了“適應不了環(huán)境,就改變環(huán)境”的想法,與產品團隊溝通修改需求。對此,劉香男表示:“其實在產品研發(fā)過程中修改需求很正常。但70℃散熱極值的確是用戶的關鍵需求,為此,產品團隊與研發(fā)團隊也是進行持續(xù)溝通,幫助研發(fā)團隊理解需求和尋找可行方案。有時候再堅持堅持,捅破那層窗戶紙,方案就找到啦?!?/p>

為此,研發(fā)團隊再次拆解和梳理需求,把關鍵點、矛盾點逐一列舉出來,利用思維導圖將問題點按照大小級別進行分類,以求尋找到關鍵的突破口。正當研發(fā)團隊再次陷入僵局,一塊加班中用來充饑的三明治引發(fā)了研發(fā)團隊的靈感。

三明治各種食材層層疊加的形狀,讓研發(fā)工程師們意識到可以借鑒到邊緣計算設備的散熱上,散熱上蓋底部壓鑄出導熱凸臺,通過導熱凸臺與導熱界面材料、熱源部件依次貼合的結構,可以排出熱源上方的空氣,大大消除內部界面熱阻。

窗戶紙終于捅破了!“三明治”散熱架構就此誕生,散熱蓋、凸臺、界面材料、熱源從上到下就類似一塊三明治。不僅如此,研發(fā)團隊還針對邊緣服務器百變的配置需求,設計了不同形狀上蓋,讓導熱凸臺、界面材料的位置、大小隨著內部器件的變化而變化,實現(xiàn)產品的靈活百變和高效散熱。

付長昭介紹:“研發(fā)團隊前前后后做了七版方案,終于經(jīng)過不斷努力,尋找到最為合理的方案?!?/p>

有了整體的方案之后,接下來就是細心打磨、不斷優(yōu)化的階段。例如,三明治的多層食材中,每一層食材的不同、食材的多少都會決定三明治的口感;同理,在“三明治”散熱架構中,每一層材料的區(qū)別是否也會帶來散熱效果的不同?為此,研發(fā)人員進行了仔細研究發(fā)現(xiàn),界面材料厚度的微小差異,都會影響散熱的效率,材料厚度縮小0.6毫米,CPU的溫度就可以降低2.1℃。因此,研發(fā)團隊需要在CPU、內存等等部件凸臺最小結構公差下,設計出最小厚度的界面材料。

經(jīng)過多次仿真和實測,研發(fā)人員最終采用高導熱和高壓縮性的界面材料和凸臺填充在熱源與散熱外殼之間,導熱效率達到10W/m·K,是空氣導熱效率的435倍,讓服務器適應的極限環(huán)溫從原來的60℃提升到67℃。

67℃已經(jīng)超越了很多邊緣設備的極限值,但這還不夠,離最終需求還差3℃。正所謂行百里者半九十,最后這3℃最為接近極限需求,那么,還能有繼續(xù)優(yōu)化的空間么?

對此,付長昭介紹:“把CPU散熱這個最大難點解決了,等于大幅提升了內部熱傳導效率,相當于成功了一大半。接下來,可以從邊緣計算設備整體散熱的角度去優(yōu)化考慮,從機箱結構、每個部件等方面做到最優(yōu)?!?/p>

隨后,研發(fā)團隊從“設備與環(huán)境之間如何進行高效導熱”的角度出發(fā),利用熱仿真軟件對多組參數(shù)組合進行對比分析,并繪制響應面優(yōu)化曲線,最終確定出一組關于鰭片厚度、間隙和高度的最優(yōu)組合,在有限體積內形成超過3000平方厘米的散熱面積,達到了最佳散熱能力。同時,為了進一步讓上蓋均勻的將熱量擴散出去,消除局部熱點,散熱上蓋中設計了2D熱管網(wǎng)絡,熱管走向經(jīng)過反復優(yōu)化仿真,精準布局,有效規(guī)避局部熱點的產生,提升整機均溫能力。

終于,浪潮邊緣微服務器EIS 800這臺能夠在無風條件下、70℃極限環(huán)境也能高效、穩(wěn)定運行的邊緣計算設備橫空出世。

“從最開始有一些抵觸,到接受挑戰(zhàn),再到陷入煎熬,最后取得豁然開朗般的突破,研發(fā)工程師整個心理過程是在微妙變化的。有時候多一份堅持,問題也就迎刃而解,付出也是值得的?!备堕L昭如是說。

據(jù)悉,浪潮邊緣微服務器EIS 800已經(jīng)獲得2022年度德國紅點設計大獎,并且在制造、交通、能源、水利、零售等多個行業(yè)用戶的環(huán)境中通過了POC驗證,未來將在各個邊緣場景中發(fā)揮重要作用,進一步推動邊緣計算產業(yè)走向落地。

模塊化設計應需而變:一切為了邊緣計算

“邊緣計算設備的產品設計與規(guī)劃,并不會圍繞某個部件的迭代而展開,而是會從實際需求的角度進行迭代。”這是劉香男兩年來最大的感悟。

不過,邊緣場景需求的差異化、多樣化,的確又是橫跨在邊緣計算設備走向規(guī)模化的一大難題。差異化和多樣化意味著大量需求彼此互斥,需要單獨設計,產品通用性差,后期的維護、保障也會遇到各種問題。如何改變這種局面,真正讓邊緣計算走向落地?

在經(jīng)歷了大量調研和反復論證之后,浪潮信息提出了解耦模塊化設計的思路。這種思路類似樂高搭積木,形成核心計算模組、AI模組、通信模組、管理模組、散熱模塊等核心模塊,統(tǒng)一不同模塊的接口標準,再根據(jù)邊緣場景的差異化需求進行拆解和組合,實現(xiàn)不同邊緣場景的產品需求。

例如,智慧路口場景中,攝像頭從幾路到十幾路,邊緣計算設備的算力需要階梯式布局;又如,在工業(yè)場景,需要更加靈活的通信方式,需要兼容有和無線不同網(wǎng)絡通信;而針對油井、礦山等環(huán)境會出現(xiàn)的邊緣設備低溫啟動難的問題,浪潮信息研發(fā)團隊還為系統(tǒng)設計了遠程運維模塊,低溫熱啟動裝置,可以在環(huán)境溫度-40℃的環(huán)境下,遠程或自動調動系統(tǒng)來加熱邊緣計算設備,讓設備每部每個組件滿足溫度要求后再啟動運行。

從模塊組件解耦到根據(jù)需求進行靈活組合,既考驗邊緣設備研發(fā)團隊的整體設計能力,又對于模塊之間組合后的產品效果提出挑戰(zhàn)。為此,浪潮信息不斷摸索,推出了邊緣模塊化設計架構ECOM(Edge Computing Optional Module),并且對各個模塊之間通信進行優(yōu)化。

據(jù)悉,浪潮信息已經(jīng)將邊緣計算模塊化設計標準ECOM貢獻給全球開放計算組織ODCC。付長昭坦言:“傳統(tǒng)服務器的設計方式、理念、應用和標準比較清晰統(tǒng)一,但邊緣計算依然處于探索期,更加需要有意識地去完善標準,從而更好地推動邊緣計算技術快速落地?!?/p>

星空不問趕路人,歲月不負有心人。如今,浪潮信息蟬聯(lián)中國邊緣服務器市場第一,2022年上半年市場占有率甚至達到53.1%,同比大幅增長133.6%,領漲邊緣服務器市場?!袄顺毙畔掷m(xù)以客戶為中心,貼近用戶場景需求,攜手生態(tài)伙伴共同推動邊緣計算加速落地。”劉香男最后表示道。

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2022-10-27
挑戰(zhàn)-40℃-70℃,邊緣計算設備再次突破極限值
計算是智慧時代一個永恒的話題。那邊廂云計算已是熱火朝天,這邊廂邊緣計算已呈燎原之勢。 有人形容,邊緣計算是“人工智能的最后一公里”...

長按掃碼 閱讀全文