算力是數(shù)字經(jīng)濟(jì)的關(guān)鍵底座,當(dāng)前智算中心的建設(shè)如火如荼,成為推動社會進(jìn)步和經(jīng)濟(jì)發(fā)展的重要引擎。智算中心不僅需要強(qiáng)大的計算能力,還需要高效的數(shù)據(jù)存儲與網(wǎng)絡(luò)互聯(lián)。對于智算中心而言,算力是核心、存儲是保障、而網(wǎng)絡(luò)是基礎(chǔ),一個高效、穩(wěn)定、低延遲的網(wǎng)絡(luò)系統(tǒng)對于智算中心的建設(shè)和運行至關(guān)重要。
近日,在浪潮網(wǎng)絡(luò)2024新品發(fā)布暨合作伙伴大會上,正式發(fā)布了“元脈”全棧AI網(wǎng)絡(luò)方案,方案以系統(tǒng)化視角,充分結(jié)合大模型訓(xùn)練與推理的實際痛點需求,為AIGC智算中心網(wǎng)絡(luò)的構(gòu)建提供全面、創(chuàng)新解決方案,幫助用戶構(gòu)建超大規(guī)模、超高帶寬、超強(qiáng)可靠,以及高度自動化的網(wǎng)絡(luò)系統(tǒng)。
需求與挑戰(zhàn):智算網(wǎng)絡(luò)的“三超”特性
從發(fā)展趨勢上來看:大模型正在“越做越大”,具有通用泛化能力的大模型正在不斷涌現(xiàn),在多個領(lǐng)域展現(xiàn)出了強(qiáng)大的應(yīng)用潛力;同時大模型也在”越做越小”,基于通用大模型微調(diào)得到的行業(yè)大模型,以及進(jìn)一步形成的垂直大模型,正在成為AI技術(shù)發(fā)展的新趨勢。
隨著百模大戰(zhàn)逐漸進(jìn)入白熱化,萬億參數(shù)成為各大玩家競爭的高地,萬卡集群成為AI算力系統(tǒng)設(shè)計的起點,萬卡集群間的網(wǎng)絡(luò)互聯(lián)挑戰(zhàn)被迅速放大,達(dá)到了前所未有的高度。
超大規(guī)模:網(wǎng)絡(luò)設(shè)備的吞吐能力、端口帶寬及密度、SerDes速率都需要全面提升,以支撐構(gòu)建超大規(guī)模智算中心架構(gòu),組網(wǎng)架構(gòu)也需要結(jié)合業(yè)務(wù)需求進(jìn)行不斷優(yōu)化。
超高帶寬:為了應(yīng)對智算中心內(nèi)海量數(shù)據(jù)的快速傳輸需求,網(wǎng)絡(luò)系統(tǒng)必須具備超高的帶寬能力,突破帶寬瓶頸,確保數(shù)據(jù)在訓(xùn)練和推理過程中的快速、無縫傳輸。
超強(qiáng)可靠:在智算中心中,網(wǎng)絡(luò)的可靠性至關(guān)重要。如何通過冗余設(shè)計和智能化故障檢測,實現(xiàn)網(wǎng)絡(luò)系統(tǒng)的高可用性和數(shù)據(jù)傳輸?shù)倪B續(xù)性,對保證智算中心穩(wěn)定運行非常關(guān)鍵。
自動化管理:隨著智算中心規(guī)模的不斷擴(kuò)大,手動管理變得越來越復(fù)雜和低效。如何引入高度自動化的管理平臺,實現(xiàn)網(wǎng)絡(luò)資源的智能分配和優(yōu)化,成為提升運維效率和降低成本的關(guān)鍵。
破局之道:浪潮網(wǎng)絡(luò)“元脈”全棧AI網(wǎng)絡(luò)方案
針對智算網(wǎng)絡(luò)的“三超”挑戰(zhàn),浪潮網(wǎng)絡(luò)發(fā)布“元脈™全棧AI網(wǎng)絡(luò)方案”,它由智算網(wǎng)絡(luò)管控&分析平臺ICE、AI計算網(wǎng)、存儲網(wǎng)、管理網(wǎng)四部分組成。方案主要優(yōu)勢如下:
全棧產(chǎn)品,全面覆蓋:元脈全棧AI網(wǎng)絡(luò)方案提供涵蓋AIGC計算網(wǎng)、存儲網(wǎng)和管理網(wǎng)的全棧產(chǎn)品,吞吐性能從12.8Tbps、25.6Tbps、到業(yè)界目前最高的51.2Tbps。CN9500-128D交換機(jī)(51.2T)在兩層架構(gòu)組網(wǎng)下最大支持32K GPU集群,能夠滿足不同規(guī)模智算中心的需求,提供高度靈活的網(wǎng)絡(luò)架構(gòu)。
融合方案,最優(yōu)選擇:元脈全棧AI網(wǎng)絡(luò)方案還與計算、存儲和算力調(diào)度平臺等深度融合,幫助用戶實現(xiàn)資源的最優(yōu)配置和利用,融合方案帶來的高性能和高可靠性,可以降低智算中心總體擁有成本(TCO)。
系統(tǒng)能力,最佳實踐:元脈全棧AI網(wǎng)絡(luò)方案基于最佳實踐,提供系統(tǒng)級的優(yōu)化與服務(wù)能力。自動化管控分析平臺ICE,能夠降低AI集群部署時間近50%,同時基于無損以太網(wǎng)技術(shù)可節(jié)約網(wǎng)絡(luò)成本25%。
引領(lǐng):云邊協(xié)同智慧網(wǎng)絡(luò),構(gòu)筑算力聯(lián)接基石
浪潮網(wǎng)絡(luò)作為云邊協(xié)同智慧網(wǎng)絡(luò)概念引領(lǐng)者,將在高性能云中心網(wǎng)絡(luò)、多模態(tài)邊緣網(wǎng)絡(luò)、領(lǐng)先的融合方案方面持續(xù)發(fā)力,致力于構(gòu)建開放、融合、易用、智能的網(wǎng)絡(luò)聯(lián)接力,推動算力從中心到邊緣側(cè)不斷延申,助力AI+應(yīng)用,讓算力觸手可及。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )