新華三李玉濤:擺脫AGI蠻力計算,異構算力網(wǎng)絡成為“必選項”

4月28日消息(趙婷婷)大模型時代,對算力的需求是永無止境的,大規(guī)模智算中心建設如火如荼。然而,“大算力”的釋放與價值實現(xiàn),離不開強大網(wǎng)絡的支撐。網(wǎng)絡不僅是連接算力單元的紐帶,更決定了算力調度、數(shù)據(jù)流通的效率與穩(wěn)定性。構建與算力規(guī)模相匹配的“大網(wǎng)絡”,成為智算中心建設與運營的重要議題。

作為網(wǎng)絡產(chǎn)業(yè)的領軍者,新華三正以其前瞻性的技術布局、多元的創(chuàng)新產(chǎn)品與解決方案,豐厚的實踐經(jīng)驗,積極推動智算中心“大網(wǎng)絡”的構建與發(fā)展,助力客戶在大模型時代從容應對算力挑戰(zhàn),實現(xiàn)業(yè)務價值的最大化。

新華三集團副總裁、網(wǎng)絡產(chǎn)品線副總裁、交換機產(chǎn)品線總經(jīng)理李玉濤在接受C114采訪時表示,異構算力體系可以充分發(fā)揮各種計算設備的優(yōu)勢,具備多樣性、靈活性、高效性等特點。新華三聚焦網(wǎng)絡優(yōu)勢,提供強大、靈活、多元且具備高支撐度的異構算力網(wǎng)絡架構,能夠最大程度釋放芯片潛能,并堅持開放合作方向,攜手產(chǎn)業(yè)鏈伙伴共同構建創(chuàng)新、包容的生態(tài)圈。

新華三集團副總裁、網(wǎng)絡產(chǎn)品線副總裁、交換機產(chǎn)品線總經(jīng)理 李玉濤

擺脫AGI蠻力計算:異構算力網(wǎng)絡成為“必選項”

隨著AI技術特別是大模型技術的突飛猛進,AI的應用范圍正從基礎的文本、語音處理擴展至復雜的視頻處理及其他未知領域,以AI為核心的算力需求激增,多元異構算力增速超過通用算力成為主流。而應對AI算力需求的關鍵在于實現(xiàn)算力、存力和網(wǎng)絡轉發(fā)效率的良好結合,以實現(xiàn)端到端的整體效率。

李玉濤指出,當前智算場景的產(chǎn)品體系內,服務器平臺、GPU、網(wǎng)卡、光模塊、交換機等領域都有大量的廠商參與。網(wǎng)絡作為連接 CPU、xPU、內存、存儲等資源重要基礎設施,貫穿數(shù)據(jù)計算、存儲全流程,是拉通生態(tài)的重要介質。網(wǎng)絡的冗余性、高可靠、以及彈性,可幫助技術不成熟產(chǎn)品消除限制。

李玉濤強調,智算網(wǎng)絡的建設不僅僅是硬件設備的堆砌,“靠蠻力計算是遠遠不夠的,更強調算力效率的提升。”在智算網(wǎng)絡建設中,新華三不僅提供網(wǎng)絡硬件設備,還尤其關注綠色節(jié)能、長期運營成本、網(wǎng)絡接入密度和系統(tǒng)安全性等,旨在構建最佳的、可持續(xù)的網(wǎng)絡環(huán)境。

“面對日益增長的AI算力需求,千卡、萬卡模型已遠遠不夠了,新華三正探討構建支持百萬卡規(guī)模的超大規(guī)模智算網(wǎng)絡。”他指出。與此同時,穩(wěn)定、高可靠性的保障工作同樣重要,基于此考慮,新華三制定了智算網(wǎng)絡異構連通專項測試,可對光模塊、電纜進行高可靠性的測試驗證,解決與網(wǎng)卡互聯(lián)互通的問題,為客戶提供一套經(jīng)過驗證過的交付方案。

對于異構算力網(wǎng)絡的現(xiàn)狀與發(fā)展策略,李玉濤認為,異構算力網(wǎng)絡尚處于發(fā)展初期。目前國內已有很多生態(tài)出現(xiàn),但大多數(shù)還處于發(fā)展早期,技術成熟度有待提升。面對這一情況,新華三將更多進行“陪伴式成長”,加強與合作伙伴的緊密合作與早期課題探討,助力國內異構算力網(wǎng)絡生態(tài)的加速成熟與壯大,以更好適應新業(yè)務需求和技術環(huán)境。

三維度同時發(fā)力:夯實異構算力網(wǎng)絡基石

李玉濤表示,在通過網(wǎng)絡打通異構算力時,有三個關鍵需求:首先要有多元化產(chǎn)品支撐生態(tài)互聯(lián)互通;其次是需要全場景的網(wǎng)絡調優(yōu)能力,能實現(xiàn)GPU解耦、網(wǎng)卡解耦;再次站在客戶長期使用的視角,異構算網(wǎng)協(xié)同非常關鍵,需基于統(tǒng)一的通信庫實現(xiàn)協(xié)同調度。

多元化產(chǎn)品方面,新華三提供支持200G/400G/800G不同端口密度的盒式產(chǎn)品/框式產(chǎn)品、以及先進架構DDC(Distributed Disaggregated Chassis)產(chǎn)品,提供多種組網(wǎng)架構,滿足不同規(guī)模、不同智算平臺、不同建設環(huán)境的客戶的需要。對于網(wǎng)絡產(chǎn)品,超寬是永遠的話題。李玉濤表示,新華三2023年已經(jīng)批量出貨支持400G產(chǎn)品,800G將在今年下半年出貨,1.6T及更高速率端口更高性能的產(chǎn)品也在積極推進,助力更高的算力需求。

同時,針對不同智算場景,新華三會提供最適合的負載均衡技術組合,合理調整流量的帶寬利用問題,提升智算中心算力規(guī)模和效率。例如,SprayLink解決鏈路均衡的問題,通過實時監(jiān)控LACP/ECMP中各物理鏈路的帶寬利用率,出口隊列。緩存占用,傳輸時延等精細化數(shù)據(jù),對大象流做到基于Per-Packet方式的動態(tài)負載分擔,將每個數(shù)據(jù)包分配到當時資源最優(yōu)的鏈路上,鏈路寬帶利用率提升至95%。

李玉濤指出,DDC技術經(jīng)過實測,其性能可超越InfiniBand網(wǎng)絡,有效解決網(wǎng)絡擁塞問題,提高效率;還具備解決異構環(huán)境下生態(tài)合作問題的能力,能有效屏蔽不同廠商設備之間的差異性。其擁有極致性能與高擴展,最大支持32K GPU規(guī)模,較盒式組網(wǎng)方案效率提升20.7%;具有天然開放解耦屬性,實現(xiàn)對GPU、網(wǎng)卡解耦;優(yōu)秀部署體驗與高可靠性,可實現(xiàn)整網(wǎng)多租戶接入/隔離。

異構算網(wǎng)協(xié)同方面,支持異構GPU/網(wǎng)卡的算網(wǎng)路徑協(xié)同能力,具備兩個關鍵能力來支撐實踐。一是可利用負載均衡來提升網(wǎng)絡利用率,二是可通過控制器分析,主動進行選路與規(guī)劃仿真,從上帝視角做整網(wǎng)協(xié)同處理。

李玉濤進一步表示,新華三已經(jīng)積累了豐厚的實踐經(jīng)驗,并提供可復制解決方案。以某算力中心建設為例,面對規(guī)模超萬卡、不同GPU廠商提供的資源,新華三全程深度參與項目建設,以及前期的一些戰(zhàn)略經(jīng)驗和設計標準,例如,將光纖布線控制在100米以內,以進行超低時延實現(xiàn);在解決光模塊抖動閃斷問題時,制定上架前必須要通過全檢原則,以降低后續(xù)運維管理難度等。“新華三是真正投身實踐,通過大規(guī)模項目交付積累經(jīng)驗,并在此基礎上做其他項目的復制,做好異構算力網(wǎng)絡的落地。”他說道。

開放標準+端到端拉通:共建異構算力網(wǎng)絡新生態(tài)

在異構算力網(wǎng)絡的構建過程中,標準化與產(chǎn)業(yè)生態(tài)是非常重要的。

從大規(guī)模智算中心網(wǎng)絡演進技術路徑來看,業(yè)界普遍認為,增強無損以太網(wǎng)將逐漸成為市場主流選擇,無損以太網(wǎng)通過重構高擴展、高穩(wěn)定、高可靠的以太網(wǎng)堆棧,有望在性價比方面媲美InfiniBand。

李玉濤表示,新華三很早就開始基于AI等關鍵業(yè)務的算力需求,前瞻探索下一代網(wǎng)絡技術和智能算力的業(yè)務布局。在去年,新華三正式加入了超以太網(wǎng)聯(lián)盟(UEC),持續(xù)推進AI時代先進網(wǎng)絡技術的探索研究和應用落地。此外,新華三在去年作為首批合作伙伴聯(lián)合中國移動研究院發(fā)布《全調度以太網(wǎng)技術架構(GSE)白皮書》。“新華三在積極參與UEC和GSE的標準化進程,攜手產(chǎn)業(yè)鏈共建技術生態(tài)。”

計算與網(wǎng)絡融合的技術體系復雜,涵蓋計算網(wǎng)絡化、網(wǎng)絡計算化、算網(wǎng)安全等多個層面,目前仍缺乏統(tǒng)一的標準體系。李玉濤指出,算網(wǎng)聯(lián)動技術是產(chǎn)業(yè)鏈關注的重點和難點,新華三將積極與生態(tài)伙伴組建統(tǒng)一的通信庫,共同定義包括數(shù)據(jù)格式、通信協(xié)議、接口API等規(guī)范,在模型層面能實現(xiàn)相互兼容,減少模型遷移過程中的障礙。不僅如此,新華三還把去年推出的百業(yè)靈犀大模型成功適配于現(xiàn)網(wǎng)中,通過自動化和智能化的AI工具使能,大幅降低網(wǎng)絡運維、排障的復雜度,有力支持整體算力服務的高效運行。

紙上得來終覺淺,絕知此事要躬行。據(jù)李玉濤介紹,為驗證智算中心異構算力組網(wǎng)架構,新華三和多個生態(tài)伙伴積極合作,搭建了一套包括多廠商、多型號在內的GPU集群,以及高性能存儲系統(tǒng)用于模型測試。“通過嚴格適配與驗證,我們可以把參數(shù)調到最優(yōu),無論客戶選擇何種算力卡型,新華三都可以提供高可靠的網(wǎng)絡服務。”

采訪最后,李玉濤強調,生態(tài)的開放共贏是大勢所趨,保持開放性對企業(yè)成功與長遠發(fā)展至關重要。新華三會堅持開放與標準化方向,實現(xiàn)對客戶業(yè)務的端到端拉通,并且引入更多生態(tài)伙伴,共建異構算力網(wǎng)絡開放合作新生態(tài)。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2024-04-28
新華三李玉濤:擺脫AGI蠻力計算,異構算力網(wǎng)絡成為“必選項”
新華三李玉濤:擺脫AGI蠻力計算,異構算力網(wǎng)絡成為“必選項”,C114訊 4月28日消息(趙婷婷)大模型時代,對算力的需求是永無止境的,大規(guī)模智算中心建設如火如荼

長按掃碼 閱讀全文