既要省錢(qián)省地,還要綠色低碳?42kW智算風(fēng)冷算力倉(cāng)滿(mǎn)足你

我們正在進(jìn)入AI(人工智能)時(shí)代,以大語(yǔ)言模型為代表的AI技術(shù)的加速普及,使得訓(xùn)練和推理的算力需求大增。

國(guó)內(nèi)市場(chǎng),智算中心的建設(shè)如火如荼。知名研究機(jī)構(gòu)IDC預(yù)測(cè),到2027年,中國(guó)生成式AI的投資規(guī)模將超過(guò)130億美元,五年復(fù)合增長(zhǎng)率高達(dá)86.2%。

不過(guò),就在智算中心迅猛發(fā)展的同時(shí),一些突出的矛盾也正在凸顯出來(lái)。根據(jù)老冀的觀察,主要有以下兩大矛盾:

1.算力需求高速增長(zhǎng)與投資硬約束的矛盾。如今,AIGC(生成式人工智能)仍在大發(fā)展,對(duì)于AI算力的需求還在高速增長(zhǎng),這就使得智算中心的算力規(guī)模要比傳統(tǒng)數(shù)據(jù)中心至少高出一個(gè)數(shù)量級(jí),這也意味著芯片、服務(wù)器以及各種配套成本都會(huì)顯著上升。另一方面,客戶(hù)用于建設(shè)智算中心的資金、場(chǎng)地、人工往往都存在預(yù)算硬約束。如何在滿(mǎn)足現(xiàn)實(shí)預(yù)算硬約束的條件下,建設(shè)面向未來(lái)的智算中心,這是一個(gè)“既要又要”的大難題。

2.高能耗與綠色低碳之間的矛盾。智算中心算力規(guī)模的急劇膨脹,使得其對(duì)電力、水等諸多資源的消耗也出現(xiàn)了高速增長(zhǎng);而資源的消耗,也會(huì)增加碳排放。 隨著“雙碳”可持續(xù)發(fā)展目標(biāo)的提出,客戶(hù)在建設(shè)智算中心的同時(shí),還要遵循綠色低碳的諸多要求。如何平衡巨量能源消耗與綠色發(fā)展的矛盾,同樣也是一大難題。

如何才能破解這兩大矛盾?作為算力基礎(chǔ)設(shè)施供應(yīng)商的浪潮信息,適時(shí)推出了42kW智算風(fēng)冷算力倉(cāng)解決方案,并成功在西南某智算中心投入運(yùn)營(yíng),從而提供了解決兩大矛盾的鑰匙。下面,老冀就給大家具體分析一下浪潮信息的這套解決方案。

省錢(qián)省地背后的秘密

如何解決算力需求高速增長(zhǎng)與投資硬約束的矛盾?42kW智算風(fēng)冷算力倉(cāng)給出的答案,就是“高密度部署”。

在很多人的印象中,風(fēng)冷數(shù)據(jù)中心的單機(jī)柜功率只有3~7kW,不可能滿(mǎn)足客戶(hù)對(duì)超大規(guī)模算力的需求。難不成,漫山遍野全都建成智算中心?

實(shí)際上,業(yè)界已經(jīng)在嘗試高密度部署的風(fēng)冷智算中心,一般能做到單機(jī)柜功率20kW左右。而如今,浪潮信息創(chuàng)新發(fā)布的42kW智算風(fēng)冷算力倉(cāng),功率密度在現(xiàn)有高密方案的基礎(chǔ)上直接翻倍,單機(jī)柜可部署AI服務(wù)器的數(shù)量是傳統(tǒng)風(fēng)冷機(jī)柜的8-10倍以上,這也意味著同樣的占地面積,可以部署的算力規(guī)模是原來(lái)的8-10倍以上。

由此,42kW智算風(fēng)冷算力倉(cāng)在輸出超高密度算力、挑戰(zhàn)風(fēng)冷極限的同時(shí),相比傳統(tǒng)數(shù)據(jù)中心,大幅減少了機(jī)柜數(shù)量和空調(diào)數(shù)量,減少了40%的模塊部署量和60%的建設(shè)用地,從而大大節(jié)約了智算中心的建設(shè)成本。

下面,咱們具體可以通過(guò)計(jì)算實(shí)例,把采用42kW智算風(fēng)冷算力倉(cāng)的智算中心,與現(xiàn)階段高密度風(fēng)冷數(shù)據(jù)中心的投資成本做個(gè)對(duì)比:

以某小型智算中心為例。為了滿(mǎn)足AI算力的需求,需要部署32臺(tái)AI服務(wù)器,目前單臺(tái)AI風(fēng)冷服務(wù)器的功耗約為10.5kW。如果采用與現(xiàn)階段高密度風(fēng)冷數(shù)據(jù)中心一致的規(guī)格進(jìn)行部署,單機(jī)柜一般能支持20kW左右,這樣就需要16臺(tái)機(jī)柜、4臺(tái)配電柜、8臺(tái)空調(diào)。而采用42kW智算風(fēng)冷算力倉(cāng)呢??jī)H需部署8臺(tái)機(jī)柜、8臺(tái)空調(diào),節(jié)省了50%的柜位。

與此同時(shí),機(jī)柜的減少,也減少了IB線(xiàn)纜之間的互聯(lián)距離,預(yù)計(jì)能夠節(jié)約50% IB線(xiàn)纜成本。

綜合算下來(lái),如果采用42kW智算風(fēng)冷算力倉(cāng)建設(shè)智算中心,基礎(chǔ)設(shè)施初期投資可節(jié)省將近100萬(wàn)元;智算中心投入運(yùn)營(yíng)之后,每年還能夠節(jié)約超過(guò)120萬(wàn)元的電費(fèi),大幅降低了智算中心的總體投資成本。

此外,節(jié)約下來(lái)的還有時(shí)間成本。由于42kW智算風(fēng)冷算力倉(cāng)采用了模塊化設(shè)計(jì)與預(yù)制化安裝,例如出廠集成冷熱通道門(mén),無(wú)需施工搭建傳統(tǒng)風(fēng)冷通道件等,從而將智算中心的建設(shè)工期從14天縮減至5天,同時(shí)還采用了AIStation管理軟件節(jié)省調(diào)試時(shí)間,做到上電即上線(xiàn),使智算中心盡快具備業(yè)務(wù)使用要求,實(shí)現(xiàn)快速部署上線(xiàn)。

當(dāng)客戶(hù)對(duì)高密部署和快速投運(yùn)有廣泛需求,而又受到場(chǎng)地、設(shè)備、成本等限制,并不具備液冷的部署條件時(shí),42kW智算風(fēng)冷算力倉(cāng)就是最佳的、且經(jīng)過(guò)大規(guī)模實(shí)踐驗(yàn)證的高密風(fēng)冷智算中心解決方案。

創(chuàng)新技術(shù)打造綠色低碳

緊接著,智算中心的高能耗與綠色低碳之間的矛盾,又如何解決?浪潮信息的42kW智算風(fēng)冷算力倉(cāng)同樣拿出了一整套創(chuàng)新的解決方案:

一、創(chuàng)新散熱及供電設(shè)計(jì)

為解決高密部署帶來(lái)的散熱難題,同時(shí)降低能耗,浪潮信息對(duì)智算中心散熱及供電進(jìn)行創(chuàng)新設(shè)計(jì)。一方面,采用封閉冷熱通道,從而縮短了送風(fēng)距離,避免傳統(tǒng)大空間彌漫式送風(fēng)導(dǎo)致的風(fēng)量處理不集中及冷量散失問(wèn)題,實(shí)現(xiàn)冷量100%利用。與此同時(shí),還采用了機(jī)柜內(nèi)外縫隙全密封式設(shè)計(jì),可避免冷、熱氣流短路及熱風(fēng)倒灌問(wèn)題,實(shí)現(xiàn)算力倉(cāng)外“0”噪音。

另一方面,由于高密機(jī)柜與列間空調(diào)采用配比接近1:1的間隔布局,假如端部空調(diào)故障會(huì)導(dǎo)致風(fēng)量分配不均,超高功率密度部署風(fēng)冷散熱不均衡,極易出現(xiàn)局部熱點(diǎn)。為解決相關(guān)問(wèn)題,算力倉(cāng)專(zhuān)門(mén)針對(duì)空調(diào)的布局做了全新的設(shè)計(jì)和優(yōu)化,以使氣流組織達(dá)到最佳狀態(tài)。在這里,浪潮信息設(shè)計(jì)了一套獨(dú)創(chuàng)的空調(diào)雙群控策略,它能夠根據(jù)冷熱通道布局的溫濕度傳感器數(shù)據(jù)變化,嵌套兩組輪巡調(diào)控算法,實(shí)時(shí)調(diào)節(jié)空調(diào)送風(fēng)模式,可完全避免因單臺(tái)空調(diào)設(shè)備故障或輪巡休眠出現(xiàn)的局部熱點(diǎn)問(wèn)題,在提升系統(tǒng)的可靠性的同時(shí)提升能效水平。

此外,42kW智算風(fēng)冷算力倉(cāng)的列間空調(diào)還采用了高溫進(jìn)水模式,與冷熱通道全密封結(jié)合起來(lái),相比傳統(tǒng)風(fēng)冷數(shù)據(jù)中心,制冷系統(tǒng)能效比有效提升10%以上。

同時(shí),為實(shí)現(xiàn)高效供電,浪潮信息還對(duì)智算中心的供配電系統(tǒng)進(jìn)行了創(chuàng)新設(shè)計(jì),采用了中壓配電+變壓器+濾波補(bǔ)償+高效UPS+末端智能母線(xiàn)的全供電鏈路一體設(shè)計(jì),實(shí)現(xiàn)兆瓦級(jí)一體解決方案,供電效率大幅提升,降低電能損耗30%以上。

由于采用了這一系列的創(chuàng)新設(shè)計(jì),42kW智算風(fēng)冷算力倉(cāng)可將智算中心風(fēng)冷散熱的PUE降到1.25以下,遠(yuǎn)低于傳統(tǒng)風(fēng)冷數(shù)據(jù)中心。

而這正契合了當(dāng)前綠色低碳的要求。2024年7月,國(guó)家發(fā)改委等四部委印發(fā)了《數(shù)據(jù)中心綠色低碳發(fā)展專(zhuān)項(xiàng)行動(dòng)計(jì)劃》,對(duì)數(shù)據(jù)中心PUE進(jìn)行了嚴(yán)格限制要求:2025年底,新建/改擴(kuò)建大型及超大型數(shù)據(jù)中心PUE不超過(guò)1.25,國(guó)家樞紐節(jié)點(diǎn)PUE不超過(guò)1.2。

二、智能運(yùn)營(yíng)

對(duì)于智算中心來(lái)說(shuō),綠色低碳必然會(huì)體現(xiàn)在其生命周期的全過(guò)程,這也意味著除了項(xiàng)目的建設(shè)階段之外,建成之后的運(yùn)營(yíng)同樣也很重要。如果能夠?qū)崿F(xiàn)更加智能的管理和運(yùn)維,勢(shì)必將大大減少智算中心的人員和資源配置,同樣也是為綠色低碳做了貢獻(xiàn)。

對(duì)此,浪潮信息InManage管理平臺(tái)下足了功夫,它首先解決了傳統(tǒng)數(shù)據(jù)中心IT和動(dòng)力環(huán)境割裂的問(wèn)題,實(shí)現(xiàn)了一套系統(tǒng)同時(shí)采集智算中心的IT基礎(chǔ)設(shè)施和動(dòng)力環(huán)境兩種數(shù)據(jù),解決數(shù)據(jù)不互通問(wèn)題,并對(duì)數(shù)據(jù)進(jìn)行了5大功能創(chuàng)新,包括高密單排微模塊2D/3D可視化、供配電系統(tǒng)鏈路展示、數(shù)據(jù)中心實(shí)時(shí)圖像監(jiān)控及視頻回放、數(shù)據(jù)中心門(mén)禁安全管理、核心制冷部件遠(yuǎn)程調(diào)控。

舉個(gè)例子。過(guò)去,為了保證核心制冷部件的安全可靠,運(yùn)維人員只能進(jìn)入機(jī)房,對(duì)其進(jìn)行現(xiàn)場(chǎng)操作。如今有了核心制冷部件遠(yuǎn)程調(diào)控這個(gè)創(chuàng)新的功能,運(yùn)維人員只需要坐在控制室內(nèi),就能夠完成全套調(diào)整動(dòng)作。

有了如此智能的管理平臺(tái)作為基礎(chǔ),老冀有理由相信,未來(lái)客戶(hù)還能夠開(kāi)發(fā)出更多實(shí)用、好用的運(yùn)維功能和服務(wù),并提供更加靈活的AI服務(wù),例如在資源上納管裸金屬和容器、以卡時(shí)的形式出售GPU和算力資源、通過(guò)拖拽方式即可直接租用成熟大模型框架和應(yīng)用等等。

因此,對(duì)于客戶(hù)來(lái)說(shuō),采用42kW智算風(fēng)冷算力倉(cāng)只是個(gè)開(kāi)始,后續(xù)還有很多文章可以做。

正當(dāng)其時(shí)

從以上分析大家應(yīng)該不難看出,對(duì)于當(dāng)前渴望擁有智算中心的大多數(shù)主流客戶(hù)來(lái)說(shuō),42kW智算風(fēng)冷算力倉(cāng)是一套“剛剛好”的解決方案,它能夠有效解決算力需求高速增長(zhǎng)與投資硬約束、高能耗與綠色低碳這兩大矛盾,滿(mǎn)足這些客戶(hù)的現(xiàn)實(shí)需求。相對(duì)液冷,它的建設(shè)周期更快,能夠在傳統(tǒng)機(jī)房做高密化快速部署;相對(duì)傳統(tǒng)風(fēng)冷,則有更高的部署密度和接近于液冷的 PUE,實(shí)現(xiàn)更好的節(jié)能降耗。

不過(guò),客戶(hù)往往也有個(gè)不小的顧慮:隨著AI服務(wù)器功耗及單機(jī)柜功率密度持續(xù)攀升,未來(lái)高密風(fēng)冷智算中心是否還能繼續(xù)滿(mǎn)足算力需求?老冀認(rèn)為大可不必?fù)?dān)心,原因有兩點(diǎn):

第一點(diǎn),據(jù)老冀了解,浪潮信息還會(huì)對(duì)智算風(fēng)冷算力倉(cāng)技術(shù)進(jìn)行持續(xù)升級(jí),未來(lái)我們還會(huì)看到更高單機(jī)柜功率密度的智算風(fēng)冷解決方案,足以滿(mǎn)足目前主流客戶(hù)對(duì)智算中心擴(kuò)容和進(jìn)一步拓展算力的需求。

同時(shí),浪潮信息也在持續(xù)推動(dòng)液冷技術(shù)創(chuàng)新與應(yīng)用,未來(lái)還會(huì)推出單機(jī)柜功率超過(guò)100kW的液冷算力倉(cāng)產(chǎn)品,以滿(mǎn)足客戶(hù)更高密度、更高能效、更低PUE的需求。

第二點(diǎn),新技術(shù)的發(fā)展和普及,需要遵循行業(yè)基本規(guī)律,老冀舉個(gè)汽車(chē)行業(yè)的例子。

大家都知道,咱們國(guó)家新能源汽車(chē)發(fā)展很快,目前的滲透率已經(jīng)超過(guò)了50%。但是,新能源汽車(chē)大發(fā)展,并不意味著汽車(chē)市場(chǎng)馬上就進(jìn)入純電時(shí)代。相反,由于很多消費(fèi)者都存在續(xù)航焦慮和對(duì)于補(bǔ)能便利性的擔(dān)心,在當(dāng)前這個(gè)階段,他們往往會(huì)選擇購(gòu)買(mǎi)兼容燃油的混合動(dòng)力汽車(chē)。

中國(guó)汽車(chē)工業(yè)協(xié)會(huì)的數(shù)據(jù)顯示,今年前5個(gè)月,混合動(dòng)力汽車(chē)的銷(xiāo)量仍然占到了中國(guó)新能源汽車(chē)銷(xiāo)量的38%,而且銷(xiāo)量占比還有進(jìn)一步提升的趨勢(shì),這也倒逼中國(guó)幾乎所有的汽車(chē)廠商,無(wú)論是老牌燃油車(chē)廠還是造車(chē)新勢(shì)力,都在加緊推出更多的混合動(dòng)力新車(chē)。

回到算力市場(chǎng)。超大規(guī)模、超強(qiáng)算力、超低能耗是下一代智算中心的演進(jìn)方向,智算中心由風(fēng)冷走向液冷是大勢(shì)所趨,同時(shí)也有一個(gè)逐步發(fā)展的過(guò)程。而從以上兩點(diǎn)可以看出,正在加緊規(guī)劃建設(shè)智算中心的客戶(hù),會(huì)根據(jù)自身的需求場(chǎng)景和成本約束,理性地做出選擇。在未來(lái)很長(zhǎng)的時(shí)間里,風(fēng)冷和液冷都會(huì)繼續(xù)發(fā)展,滿(mǎn)足客戶(hù)的多樣化需求,并帶給客戶(hù)更多的價(jià)值。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-10-09
既要省錢(qián)省地,還要綠色低碳?42kW智算風(fēng)冷算力倉(cāng)滿(mǎn)足你
我們正在進(jìn)入AI(人工智能)時(shí)代,以大語(yǔ)言模型為代表的AI技術(shù)的加速普及,使得訓(xùn)練和推理的算力需求大增。國(guó)內(nèi)市場(chǎng),智算中心的建設(shè)如火如...

長(zhǎng)按掃碼 閱讀全文