智算中心互聯(lián):算網(wǎng)協(xié)同,構筑智算互聯(lián)新底座

1月20日消息(水易)AI時代已經來臨。大模型等新興AI應用需求海量的算力支撐,一座座智算中心拔地而起,規(guī)模龐大的萬卡集群逐漸投入商用。如何更好地實現(xiàn)智算中心互聯(lián),服務AI應用創(chuàng)新發(fā)展,業(yè)界做了大量研究工作。

1月16日,作為“2025中國光通信高質量發(fā)展論壇”的開篇之作,“智算中心互聯(lián):算網(wǎng)協(xié)同,構筑智算互聯(lián)新底座”線上研討會順利召開,邀約產業(yè)鏈專家代表,圍繞智算中心間跨地域、跨層級、跨主體、高可靠的算力協(xié)同與調度,以及智算中心互聯(lián)關鍵技術等話題展開了深入探討。

智算中心互聯(lián)呼喚網(wǎng)絡架構創(chuàng)新

中國信息通信研究院技術與標準研究所所長張海懿表示AI大模型推動智算中心向超萬卡及以上集群發(fā)展,智算中心內互聯(lián)、智算中心間互聯(lián)、智算應用支撐等高質互聯(lián)成為關注熱點。

具體而言,為支撐萬億及以上量級參數(shù)量大模型訓練,智算中心內互聯(lián)需滿足超大規(guī)模組網(wǎng)、大帶寬、超低時延、高可用性等需求。為突破電力供應、機房空間等瓶頸,智算中心間互聯(lián)成為重要補充,需要通過長距無損、極低故障率的互聯(lián)能力來支撐構建分布式智算集群。為支撐多場景、多業(yè)務、大流量入算等智算業(yè)務,需要長距高可靠、任務式帶寬、高效流量調度。

針對上述需求,產業(yè)界已進行了諸多探索。智算中心內互聯(lián)方面,相關片間和組網(wǎng)互聯(lián)協(xié)議技術競相發(fā)展,集合通信庫異構兼容或成未來競爭優(yōu)勢點,大帶寬需求助推高速光模塊迭代加速,線性模塊方案應用持續(xù)探索,芯片級光互聯(lián)提供高密度低能耗互聯(lián)新方案,全光交換組網(wǎng)和連接可靠性成為關注點。

智算中心間互聯(lián)方面,大帶寬、低時延和高可靠需求凸顯,智算分布式訓練應用試驗加速探索,干線400G規(guī)模部署,城域800G+逐步試驗,G.654.E、空芯光纖燈新型光纖加速助力構建高質量網(wǎng)絡。

智算業(yè)務支撐方面,全光接入為用戶提供靈活品質入算,端到端協(xié)同管控助力用戶快速入云入算,網(wǎng)絡大模型成為網(wǎng)絡自智邁向L4+關鍵技術。

在鵬城實驗室云腦研究所副所長張士勛看來,智能計算需求的急劇增長引發(fā)了大規(guī)模算力基礎設施建設熱潮,如何構建適用于大規(guī)模算力基礎設施的網(wǎng)絡架構是關鍵挑戰(zhàn)。當前,業(yè)界對智能計算網(wǎng)絡架構的探索呈現(xiàn)出多元化的發(fā)展態(tài)勢,而基于原始需求,性能、可擴展性、成本、可靠性與可維護性、以及可演進性始終是網(wǎng)絡架構選型的核心考量因素。

方案創(chuàng)新,構建高品質智算網(wǎng)絡

中國移動研究院副院長段曉東表示,如何將分布式部署的智算中心進行協(xié)同調度,充分發(fā)揮算力資源的最大效能,是業(yè)界亟需研究的關鍵問題。為此,中國移動原創(chuàng)提出無損智算OTN( Hitless intelligent computing OTN,HIC-OTN),從超大帶寬、超高可靠、超低時延三方面構建面向智算中心的新型OTN技術體系。

據(jù)了解,中國移動在全球運營商最大單集群智算中心(哈爾濱數(shù)據(jù)中心)基于無損智算OTN(HIC-OTN)完成首個104km跨智算集群PP拉遠訓練現(xiàn)網(wǎng)技術試驗,探索和驗證了百公里級跨集群PP訓練的可行性。

打造高品質智算網(wǎng)絡的過程中,作為在業(yè)界最早提出“云網(wǎng)融合”理念的運營商,中國電信認為云網(wǎng)融合下算力和網(wǎng)絡的發(fā)展途徑也開始有了新的變化,云網(wǎng)融合也隨之邁入云網(wǎng)融合3.0新階段。中國電信研究院副院長傅志仁介紹,算力發(fā)展核心逐步變化成構建以GPU為核心的智算集群,網(wǎng)絡的發(fā)展核心逐漸變化成基于智算架構的新型網(wǎng)絡,向AI native Network演進。

目前,中國電信圍繞云網(wǎng)融合3.0底座,在運力、算力、存力,以及算網(wǎng)融合、存算融合的云網(wǎng)融合底座、數(shù)據(jù)和底座融合、大模型和底座融合、應用和底座融合方面進行了一系列布局,并實現(xiàn)智算能力、創(chuàng)新環(huán)境、應用場景開放,賦能千行百業(yè),推動數(shù)字經濟發(fā)展。

中國聯(lián)通研究院副院長/首席科學家唐雄燕介紹,為了更好地支撐智算互聯(lián)的需要,2024年,中國聯(lián)通正式發(fā)布算力智聯(lián)網(wǎng)AINet,通過IP+光融合打造新質運力,實現(xiàn)算力服務與網(wǎng)絡服務協(xié)同,構建算力互聯(lián)網(wǎng)的新底座。

AINet具備三個重要特征,即“三高”核心能力,分別是高通量、高性能、高智能。唐雄燕表示,光網(wǎng)絡是構建AINet“三高”能力的關鍵底座。AINet部署了雙平面立體組網(wǎng)的400G ROADM全光智算網(wǎng)絡,同時部署了智算網(wǎng)關,實現(xiàn)網(wǎng)絡與智算的高效連接。

騰訊光網(wǎng)絡架構師李方超表示,隨著算力網(wǎng)絡的規(guī)?;l(fā)展,大模型訓練與推理應用的持續(xù)增長與園區(qū)物理資源擴展受限的矛盾愈發(fā)顯著,在此背景下騰訊協(xié)同多家用戶與合作伙伴一起推動Mega Scale Out項目,目標是解決園區(qū)內和跨園區(qū)擴展兩個層面的關鍵問題與核心能力。

產業(yè)引領,助推智算互聯(lián)高質量發(fā)展

AI大模型的算力增長以每年10倍的速度持續(xù)擴張,對芯片間的光互聯(lián)帶寬提出了極為苛刻的要求。在眾多光芯片技術中,硅光芯片憑借其獨特的優(yōu)勢脫穎而出,承載著數(shù)據(jù)中心高速光互聯(lián)的技術優(yōu)勢。

蘇州海光芯創(chuàng)光電科技股份有限公司首席科學家陳曉剛介紹,硅光產業(yè)鏈條中封測產能是關鍵瓶頸,為推動硅光芯片量產化發(fā)展,F(xiàn)abless 2.0 在封測段提出Standard(標準化),Simplified(簡單化)、Scalable(規(guī)?;?、Shared(多平臺共享)四項需求。

也是隨著AI智算中心高速光互聯(lián)速率的提升,光模塊功耗不斷增加。東莞立訊技術有限公司產品經理周小丹介紹,在200G到800G時代,采用PAM4調制,功耗就從4W增加到16W;來到1.6T時代,功耗約是在30W。同時,光模塊功耗的持續(xù)上升,也給系統(tǒng)散熱能力帶來了挑戰(zhàn)。

針對這一挑戰(zhàn),立訊技術提供了包括DPO、LRO和LPO等多種AI低功耗的解決方案。周小丹透露,立訊科技推出的多款低功耗AI光互聯(lián)解決方案,已經和業(yè)內頭部的交換機和服務器廠商進行了小批量驗證,無論是帶寬速率、功耗、誤碼率還是兼容性等方面,都完全滿足最終用戶需求。

“2025中國光通信高質量發(fā)展論壇”是由CIOE中國光博會與C114通信網(wǎng)聯(lián)合推出的大型研討會系列活動,通過多場專題論壇、線上研討會、閉門研討會等形式,聚焦產業(yè)鏈薄弱環(huán)節(jié),瞄準技術未來演進方向,發(fā)掘熱點應用場景,群策群力,貢獻行業(yè)價值,進一步助力我國光通信產業(yè)高質量發(fā)展。

下一場論壇將于2月27日上線,主題為“FTTR-B:賦能垂直行業(yè)數(shù)字化轉型”,探討FTTR如何在政企領域實現(xiàn)數(shù)字化轉型,如何在中小微企業(yè)全光內部組網(wǎng)靈活部署,如何解決傳統(tǒng)網(wǎng)絡架構的帶寬瓶頸和覆蓋難題。

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2025-01-20
智算中心互聯(lián):算網(wǎng)協(xié)同,構筑智算互聯(lián)新底座
智算中心互聯(lián):算網(wǎng)協(xié)同,構筑智算互聯(lián)新底座,C114訊 1月20日消息(水易)AI時代已經來臨。大模型等新興AI應用需求海量的算力支撐,一座座智

長按掃碼 閱讀全文