1月17日消息(趙婷婷)AI時代已經(jīng)來臨。大模型等新興AI應(yīng)用需求海量的算力支撐,一座座智算中心拔地而起,規(guī)模龐大的萬卡集群逐漸投入商用。如何更好地實(shí)現(xiàn)智算中心互聯(lián),服務(wù)AI應(yīng)用創(chuàng)新發(fā)展,業(yè)界做了大量研究工作。
1月16日,作為“2025中國光通信高質(zhì)量發(fā)展論壇”的開篇之作,“智算中心互聯(lián):算網(wǎng)協(xié)同,構(gòu)筑智算互聯(lián)新底座”線上研討會順利召開。
會上,中國信息通信研究院技術(shù)與標(biāo)準(zhǔn)研究所(以下簡稱中國信通院標(biāo)準(zhǔn)所)所長張海懿在演講時指出,當(dāng)前,我國主管部門持續(xù)發(fā)布算力基礎(chǔ)設(shè)施相關(guān)政策,引導(dǎo)算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展。AI大模型及相關(guān)應(yīng)用推動智算中心向超萬卡及以上集群發(fā)展,智算中心內(nèi)互聯(lián)、智算中心間互聯(lián)、智算應(yīng)用支撐等高質(zhì)互聯(lián)相關(guān)技術(shù)成為關(guān)注熱點(diǎn)。接下來,她介紹了相應(yīng)關(guān)鍵技術(shù)發(fā)展的具體情況。
智算中心內(nèi)互聯(lián)
張海懿指出,智算中心內(nèi)互聯(lián)一方面要支撐萬億及以上量級參數(shù)量大模型訓(xùn)練,同時還要滿足超大規(guī)模組網(wǎng)、大帶寬、超低時延、高可用性等需求。
現(xiàn)階段,智算中心內(nèi)互聯(lián)相關(guān)協(xié)議和技術(shù)競相發(fā)展,片間互聯(lián)開放與專用模式持續(xù)競爭。智算中心內(nèi)部組網(wǎng)以IB和基于以太網(wǎng)的多種方案并存方式發(fā)展,前者是以性能取勝,后者因其開放性和性價比,在 AI大模型訓(xùn)練組網(wǎng)的占比也在進(jìn)一步提升。
大規(guī)模AI訓(xùn)練需要高效協(xié)同智算中心內(nèi)軟硬件資源,快速、高效、可移植的集合通信庫成為影響智能計算效率的重要因素。目前國內(nèi)外頭部廠商主要以各自研發(fā)獨(dú)有的高速集合通信庫為主,整體上捆綁特定芯片。為進(jìn)一步高效支撐智算部署與應(yīng)用,集合通信庫異構(gòu)兼容或成未來趨勢。
同時,大帶寬需求助推高速光模塊迭代加速。數(shù)據(jù)中心直調(diào)直檢光模塊速率約3~4年更新一代,AI智算引入后迭代周期呈現(xiàn)縮短趨勢,當(dāng)前處于800Gb/s速率為主階段,預(yù)計未來1~2年進(jìn)入1.6Tb/s速率,2030年3.2Tb/s速率將走向規(guī)模應(yīng)用。在AI應(yīng)用的驅(qū)動下,高速光模塊應(yīng)用需求持續(xù)強(qiáng)勁,國內(nèi)外標(biāo)準(zhǔn)化布局加速向T+量級演進(jìn)延伸,同時為保障互聯(lián)質(zhì)量,智算中心對光模塊誤碼率等指標(biāo)可能會提出更高要求。
面對低能耗和低時延等應(yīng)用需求,線性驅(qū)動可插拔模塊(LPO)及其應(yīng)用持續(xù)研究和探索。服務(wù)器機(jī)柜間互聯(lián)采用光學(xué)方式,單通道速率正在從112G向224G演進(jìn),線性方案是降低能耗的有效途徑。當(dāng)前112G/lane LPO應(yīng)用處于探索階段,兼容性及標(biāo)準(zhǔn)化問題有待持續(xù)研究評估,224G/lane LPO預(yù)計2025年進(jìn)行互通展示,考慮到性能和能耗的均衡等問題,預(yù)計224G/lane可插拔方案傾向于線性接收可插拔光模塊(LRO)的可能性較大。
除此之外,芯片級光互聯(lián)提供高密度低能耗互聯(lián)新方案。芯片級光互連相較電互連或傳統(tǒng)可插拔模塊互連方式,具有大帶寬、低能耗、高集成等諸多優(yōu)勢。片間光互聯(lián)中,CPO主要用于交換網(wǎng)絡(luò),OIO主要用于算存網(wǎng)絡(luò),近期AI集群發(fā)展推動OIO熱度迅速上升。目前,全球領(lǐng)先的硅光平臺依托其強(qiáng)大的芯片加工制造和先進(jìn)封裝能力,在芯片級光互聯(lián)方面不斷取得新突破。
另外,從目前發(fā)展情況來看,智算與光互聯(lián)雙向賦能,光互聯(lián)作用日益凸顯,光進(jìn)銅退趨勢進(jìn)一步持續(xù),但短距的電互聯(lián)依靠其高可靠與低成本等特點(diǎn),生命力依舊旺盛。另外,考慮能耗、靈活性和可靠性等大模型訓(xùn)練及推理需求,智算中心內(nèi)的全光交換組網(wǎng)和連接可靠性成為業(yè)界的持續(xù)關(guān)注點(diǎn)。
智算中心間互聯(lián)
智算中心間互聯(lián)的典型需求是長距離、高吞吐量、算間高效協(xié)同等,需要通過長距無損、極低故障率的互聯(lián)能力來支撐構(gòu)建分布式智算集群。目前發(fā)展情況如下:
一是大帶寬、低時延和高可靠需求凸顯。智算多集群分布式訓(xùn)練可期,算間互聯(lián)業(yè)務(wù)需求包括距離相近的多個智算中心間互聯(lián)、大規(guī)模樞紐算力節(jié)點(diǎn)間的互聯(lián)以及邊緣與核心云之間的互聯(lián)與協(xié)同,來實(shí)現(xiàn)分布式訓(xùn)練、訓(xùn)練推理協(xié)同、數(shù)據(jù)搬運(yùn)等場景。同時,多種應(yīng)用需要高質(zhì)量的互聯(lián),包括大規(guī)模樞紐算力節(jié)點(diǎn)間的數(shù)據(jù)中心互聯(lián)、相近物理位置多數(shù)據(jù)中心間互聯(lián)、以及邊緣與核心數(shù)據(jù)中心間協(xié)同等。
二是智算分布式訓(xùn)練應(yīng)用試驗(yàn)加速探索?,F(xiàn)階段多家已經(jīng)開展智算分布式訓(xùn)練實(shí)驗(yàn)/試驗(yàn),但是分布式應(yīng)用仍面臨多重技術(shù)挑戰(zhàn),例如廣域網(wǎng)絡(luò)性能需求、運(yùn)維管控復(fù)雜性、建網(wǎng)成本等都是制約因素,需要在多層多域單點(diǎn)技術(shù)突破、跨層跨域多技術(shù)協(xié)同融合等方面持續(xù)推進(jìn)技術(shù)創(chuàng)新。
三是干線啟動400G規(guī)模部署,城域推動800G+逐步試驗(yàn)。目前400G技術(shù)體系基本完善,我國運(yùn)營商逐步啟動干線場景規(guī)模部署,目前400G系統(tǒng)中的 WSS、OTU已實(shí)現(xiàn)C+L波段一體化設(shè)計, 但一體化OA技術(shù)方案仍在探索驗(yàn)證之中。對于更高速率的傳輸技術(shù),業(yè)界加快800G/1.6T技術(shù)標(biāo)準(zhǔn)研制,OIF和ITU等標(biāo)準(zhǔn)化組織正在開展相關(guān)項(xiàng)目研究工作,產(chǎn)業(yè)界也已經(jīng)啟動試點(diǎn)驗(yàn)證。
四是新型光纖加速助力構(gòu)建高質(zhì)量網(wǎng)絡(luò)。一方面,G.654.E等超低損光纖成為智算中心間互聯(lián)應(yīng)用優(yōu)配,適配400G及以上超高速長距離、C+L多波段大容量等應(yīng)用,支撐優(yōu)質(zhì)互聯(lián)需求,是網(wǎng)絡(luò)傳輸性能提升的關(guān)鍵;另一方面,空芯光纖擁有諸多優(yōu)勢,發(fā)展?jié)撃芸善?,目前仍需突破制備工藝、工程部署等諸多難題,后續(xù)發(fā)展仍需業(yè)界持續(xù)加強(qiáng)協(xié)同,助力鍛造未來超低時延算力網(wǎng)。
智算應(yīng)用支撐
智算業(yè)務(wù)支撐方面,主要包括入算和端到端協(xié)同管控等功能。全光接入為用戶提供靈活品質(zhì)入算,主要包括家庭園區(qū)萬兆全光入算、中小企業(yè)便捷一跳入算、大企業(yè)高品質(zhì)專線入算等。同時,通過端到端協(xié)同管控助力用戶快速入云入算。在接入側(cè),進(jìn)一步增強(qiáng)用戶感知能力;
在數(shù)據(jù)中心互聯(lián)側(cè),實(shí)現(xiàn)基于意圖的智能化管控;在數(shù)據(jù)中心網(wǎng)絡(luò)側(cè),實(shí)現(xiàn)整個的數(shù)據(jù)中心網(wǎng)絡(luò)和數(shù)據(jù)中心互聯(lián)的協(xié)同。整體來看,用戶入算及智算訓(xùn)練等業(yè)務(wù)調(diào)度需要算網(wǎng)協(xié)同管控,綜合考慮用戶、組網(wǎng)以及算力提供者多方因素,在任務(wù)需求與算網(wǎng)資源綜合約束下,對多層級設(shè)備進(jìn)行彈性統(tǒng)一調(diào)度,在用戶和算力服務(wù)之間動態(tài)按需建立連接。
另外,網(wǎng)絡(luò)大模型成為網(wǎng)絡(luò)自智邁向L4,甚至是更高階的關(guān)鍵技術(shù)。運(yùn)營商、設(shè)備/軟件商紛紛布局網(wǎng)絡(luò)大模型,利用大模型高效的理解和生成能力增強(qiáng)網(wǎng)絡(luò)自智能力,加速智算網(wǎng)絡(luò)自智能力邁向高階自智L4。
張海懿最后表示,中國信通院標(biāo)準(zhǔn)所將持續(xù)開展智算中心互聯(lián)相關(guān)技術(shù)產(chǎn)業(yè)發(fā)展、算力網(wǎng)絡(luò)性能監(jiān)測、算力接入1ms城市行動計劃等工作,希望與業(yè)界一道協(xié)同構(gòu)建我國智算互聯(lián)網(wǎng)絡(luò)技術(shù)產(chǎn)業(yè)創(chuàng)新發(fā)展新生態(tài),助力我國光通信行業(yè)高質(zhì)量發(fā)展。
- 張文晨升任中國廣電總經(jīng)理
- 量子與人工智能:數(shù)字化轉(zhuǎn)型的力量倍增器
- 2025年物聯(lián)網(wǎng):創(chuàng)新與應(yīng)用的里程碑之年
- 新鮮出爐!烽火通信喜獲“FTTR技術(shù)創(chuàng)新獎”
- 喜訊!江波龍榮獲 “智能座艙技術(shù)創(chuàng)新獎”
- 喜訊!佰維存儲特存數(shù)通行業(yè)寬溫SSD客制化SSD寬溫解決方案榮獲“智能模組優(yōu)秀解決方案”
- 喜報來襲!烽火通信獲評“光通信產(chǎn)業(yè)創(chuàng)新技術(shù)企業(yè)”
- 榜上有名!信而泰榮獲 “智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)推動獎”
- 榜單揭曉!烽火通信喜獲“智算中心關(guān)鍵技術(shù)創(chuàng)新獎”殊榮
- 亨通F5G FTTR光電混合纜及組件榮獲C114“FTTR技術(shù)創(chuàng)新獎”
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。