人工智能迫使數(shù)據(jù)中心重新思考設(shè)計

人工智能迫使數(shù)據(jù)中心重新思考設(shè)計

隨著人工智能在企業(yè)中的大規(guī)模應(yīng)用,其后果之一是其消耗了數(shù)據(jù)中心更大比例的工作負(fù)載。

人工智能不僅將加速對數(shù)據(jù)中心的需求,為投資創(chuàng)造新的動力,而且還將對數(shù)據(jù)中心的可持續(xù)性戰(zhàn)略和要部署的基礎(chǔ)設(shè)施的性質(zhì)產(chǎn)生影響。

例如,Tirias Research預(yù)測,按照目前的情況,到2028年,生成式人工智能數(shù)據(jù)中心服務(wù)器基礎(chǔ)設(shè)施加上運營成本將超過7600萬美元,是Amazon AWS目前估計年度運營成本的兩倍多,占全球云服務(wù)市場的三分之一。

預(yù)測硬件計算性能將提高400%,這與Tirias估計的處理工作負(fù)載將增加50倍相比,相形見絀。

更高的密度

根據(jù)Schneider Electric的一份新白皮書,大型訓(xùn)練集群和小型邊緣推理服務(wù)器的爆炸式增長,也將意味著向更高機(jī)架功率密度的轉(zhuǎn)變。

白皮書稱:“人工智能初創(chuàng)企業(yè)、企業(yè)、主機(jī)托管提供商和互聯(lián)網(wǎng)巨頭現(xiàn)在必須考慮這些密度對數(shù)據(jù)中心物理基礎(chǔ)設(shè)施的設(shè)計和管理的影響。”

Schneider能源管理研究中心對人工智能對能源需求的影響做出了自己的預(yù)測。據(jù)估計,人工智能目前代表著4.3GW的電力需求,到2028年將以26%至36%的復(fù)合年增長率增長。

這將導(dǎo)致總需求達(dá)到13.5GW至20GW,是數(shù)據(jù)中心整體電力需求增長的兩到三倍。到2028年,人工智能工作負(fù)載將占數(shù)據(jù)中心總能源的20%。

Schneider指出,雖然預(yù)計會比訓(xùn)練集群消耗更多的電量,但推理工作負(fù)載可以在各種機(jī)架密度下運行。

“另一方面,人工智能訓(xùn)練工作負(fù)載一直以非常高的密度運行,每個機(jī)架的功率在20-100 kW或更高。”

“網(wǎng)絡(luò)需求和成本推動這些培訓(xùn)機(jī)架聚集在一起。這些極高功率密度的集群從根本上挑戰(zhàn)了數(shù)據(jù)中心的電源、冷卻、機(jī)架和軟件管理設(shè)計?!?/p>

動力系統(tǒng)的挑戰(zhàn)

Schneider概述了四個關(guān)鍵領(lǐng)域可能產(chǎn)生的影響:電源、冷卻、機(jī)架和軟件管理。

在電力方面,人工智能工作負(fù)載對開關(guān)設(shè)備和配電系統(tǒng)的動力系統(tǒng)提出了挑戰(zhàn)。

目前使用的一些電壓將被證明部署起來不切實際,而較小的配電塊尺寸可能會浪費IT空間。較高的機(jī)架溫度也會增加發(fā)生故障和危險的機(jī)會。

隨著數(shù)據(jù)中心過渡到液體冷卻,冷卻將是至關(guān)重要的,也是需要進(jìn)行重大改變的領(lǐng)域之一,半個多世紀(jì)以來,液體冷卻一直用于專業(yè)高性能計算。

Schneider表示:“盡管在不久的將來,空氣冷卻仍將存在,但預(yù)測,從空氣冷卻到液體冷卻的轉(zhuǎn)變將成為具有人工智能集群的數(shù)據(jù)中心的首選或必要解決方案。”

“與空氣冷卻相比,液體冷卻具有許多優(yōu)點,例如提高處理器可靠性和性能、節(jié)省空間和更高的機(jī)架密度、管道中水的熱慣性更大以及減少用水量。”

對于人工智能集群,服務(wù)器需要更深入,電力需求更大,冷卻也更復(fù)雜。

因此,機(jī)架需要具有更大的密度和承重能力。

數(shù)字孿生

最后,DCIM、BMS和電氣設(shè)計工具等軟件工具將成為管理人工智能集群的關(guān)鍵。

適當(dāng)配置和實施的軟件可以提供數(shù)據(jù)中心的數(shù)字孿生,以識別功率限制和冷卻資源的性能,從而為更好的布局決策提供信息。

在日益動態(tài)的環(huán)境中,容錯空間越小,操作風(fēng)險就會越高。因此,Schneider建議創(chuàng)建整個IT空間的數(shù)字孿生,包括機(jī)架中的設(shè)備和虛擬機(jī)。

”通過數(shù)字化添加或移動IT負(fù)載,可以驗證是否有足夠的電力、冷卻和地板承重能力來支持。這為決策提供了信息,以避免資源擱淺,并最大限度地減少可能導(dǎo)致停機(jī)的人為錯誤?!?/p>

相關(guān)推薦:

7個常見數(shù)據(jù)中心遷移挑戰(zhàn)

什么是物聯(lián)網(wǎng)中的數(shù)字孿生?

數(shù)據(jù)中心冷卻可持續(xù)發(fā)展策略

如何釋放人工智能在智慧城市中的潛力?

CIBIS峰會

由千家網(wǎng)主辦的2023年第24屆CIBIS筑智能化峰會即將正式拉開帷幕,本屆峰會主題為“智慧連接,‘筑’就未來”, 將攜手全球知名智能化品牌及業(yè)內(nèi)專家,共同探討物聯(lián)網(wǎng)、AI、云計算、大數(shù)據(jù)、IoT、智慧建筑、智能家居、智慧安防等熱點話題與最新技術(shù)應(yīng)用,分享如何利用更知慧、更高效、更安全的智慧連接技術(shù),“筑”就未來美好智慧生活。歡迎建筑智能化行業(yè)同仁報名參會,分享交流!

報名方式

成都站(10月24日):https://www.huodongxing.com/event/6715336669000

西安站(10月26日):https://www.huodongxing.com/event/3715335961700

長沙站(11月09日):https://www.huodongxing.com/event/7715337579900

上海站(11月21日):https://www.huodongxing.com/event/9715337959000

北京站(12月23日):https://www.huodongxing.com/event/3715338464800

廣州站(12月07日):https://www.huodongxing.com/event/6715338767700

更多2023年CIBIS峰會信息,詳見峰會官網(wǎng):http://summit.qianjia.com/

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-09-19
人工智能迫使數(shù)據(jù)中心重新思考設(shè)計
隨著人工智能在企業(yè)中的大規(guī)模應(yīng)用,其后果之一是其消耗了數(shù)據(jù)中心更大比例的工作負(fù)載。人工智能不僅將加速對數(shù)據(jù)中心的需求,為投資創(chuàng)造新的動力,而且還將對數(shù)據(jù)中心的可持續(xù)性戰(zhàn)略和要部署的基礎(chǔ)設(shè)施的性質(zhì)產(chǎn)生影響。

長按掃碼 閱讀全文