中國(guó)移動(dòng)程偉強(qiáng):GSE兩大模式滿足所有智算組網(wǎng)場(chǎng)景需求

9月12日消息(九九)9月11-13日,第25屆中國(guó)國(guó)際光電博覽會(huì)在深圳舉行,在同期舉辦的“智算中心光技術(shù)創(chuàng)新發(fā)展論壇”上,中國(guó)移動(dòng)研究院基礎(chǔ)網(wǎng)絡(luò)技術(shù)研究所副所長(zhǎng)程偉強(qiáng)表示,大模型技術(shù)發(fā)展趨勢(shì)總體仍然遵循ScalingLaw,參數(shù)已邁進(jìn)萬(wàn)億甚至十萬(wàn)億規(guī)模;模型結(jié)構(gòu)在原有Transformer的基礎(chǔ)上,引入了擴(kuò)散模型、MoE專家系統(tǒng),模型的泛化能力增強(qiáng)、性能提升。

程偉強(qiáng)指出,大算力仍然是大模型創(chuàng)新落地的關(guān)鍵,國(guó)內(nèi)外大型科技公司正積極投建萬(wàn)卡/超萬(wàn)卡集群智算中心。近日,作為全球運(yùn)營(yíng)商最大單集群智算中心,中國(guó)移動(dòng)智算中心(哈爾濱)正式上線投產(chǎn)。該智算中心單集群內(nèi)超過(guò)1.8萬(wàn)張AI加速卡,智能算力規(guī)模達(dá)6.9EFLOPS。

以太網(wǎng)物理層安全(PHYSec)突破加解密性能瓶頸

程偉強(qiáng)強(qiáng)調(diào),智算中心新一代以太網(wǎng)技術(shù)需要具備高帶寬、高可靠、高安全等特點(diǎn)。

在高帶寬方面,DCN和DCI正加速向800G和1.6T演進(jìn)。800GE標(biāo)準(zhǔn)、產(chǎn)業(yè)成熟,已開(kāi)始商用部署。單通道100G的IEEE802.3df標(biāo)準(zhǔn)已發(fā)布,產(chǎn)業(yè)已成熟;單通道200G的標(biāo)準(zhǔn)baseline已確定,800GE coherent新增20km光接口,支持傳統(tǒng)電信場(chǎng)景的需求,支持20/40/80km互通和共技術(shù)平臺(tái)。1.6T標(biāo)準(zhǔn)正穩(wěn)步推進(jìn),產(chǎn)業(yè)成熟、商用部署仍需時(shí)日;IEEE802.3dj重點(diǎn)關(guān)注1.6TE短距光標(biāo)準(zhǔn),OIF已領(lǐng)跑1.6T相干標(biāo)準(zhǔn)化。

中國(guó)移動(dòng)積極參與推動(dòng)IEEE P802.3df&dj工作組的800GE標(biāo)準(zhǔn)化工作,主導(dǎo)完成800GE 20km新目標(biāo)立項(xiàng),是中國(guó)公司在IEEE的首個(gè)以太網(wǎng)基礎(chǔ)標(biāo)準(zhǔn)立項(xiàng),同時(shí)主導(dǎo)通過(guò)800GE 20km/40km相干標(biāo)準(zhǔn)框架提案被工作組采納。

在高可靠方面,F(xiàn)lexLane彈性通道技術(shù),為智算網(wǎng)絡(luò)互聯(lián)提供高可靠保障。FlexLane是基于以太網(wǎng)物理層彈性通道的高可靠保障技術(shù),當(dāng)物理層檢測(cè)到lane故障后能夠進(jìn)行快速故障隔離,故障恢復(fù)后可以自愈。

在高安全方面,以太網(wǎng)物理層安全(PHYSec)突破加解密性能瓶頸。智算中心基礎(chǔ)設(shè)施承載大量數(shù)據(jù)傳輸處理,安全訴求極高;RDMASec、MACSec等安全方案在加解密帶寬開(kāi)銷、時(shí)延、硬件支持等方面存在性能瓶頸,暴露的幀頭部信息仍存在安全漏洞。中國(guó)移動(dòng)探索將傳統(tǒng)密碼學(xué)思想應(yīng)用到以太網(wǎng)物理層—PHYSec,解決現(xiàn)有技術(shù)方案的安全漏洞與性能瓶頸。

程偉強(qiáng)介紹,PHYSec具有四大優(yōu)勢(shì):一是協(xié)議透明,全加密。在物理層對(duì)比特流加密,保護(hù)所有幀頭部,掩蓋幀長(zhǎng)度、幀發(fā)送頻率。二是隨流安全,低時(shí)延。隨流加密,解密時(shí)延全掩蓋(~20ns),對(duì)AI訓(xùn)練或推理基本無(wú)影響。三是不占帶寬,低開(kāi)銷?;谖锢韺釉鷻C(jī)制承載協(xié)議,不占用用戶帶寬。四是兼容存量,易部署??苫赑HY芯片或光模塊DSP芯片實(shí)現(xiàn),安全可插拔,支持存量網(wǎng)絡(luò)平滑升級(jí)。

全調(diào)度以太網(wǎng)(GSE)兩大模式,滿足所有智算組網(wǎng)場(chǎng)景需求

程偉強(qiáng)指出,傳統(tǒng)網(wǎng)絡(luò)技術(shù)難以適應(yīng)大規(guī)模AI集群的發(fā)展需求,面臨著四大難題:大規(guī)模網(wǎng)絡(luò)擁塞控制難、突發(fā)大象流負(fù)載均衡難、巨量鏈路長(zhǎng)期穩(wěn)定運(yùn)行難、敏感隱私數(shù)據(jù)安全保障難,亟需徹底革新底層基礎(chǔ)網(wǎng)絡(luò)技術(shù)。

中國(guó)移動(dòng)原創(chuàng)提出GSE技術(shù)體系,革新以太網(wǎng)轉(zhuǎn)發(fā)機(jī)制,基于分發(fā)粒度、發(fā)流模式、轉(zhuǎn)發(fā)機(jī)制和安全加密四大原創(chuàng)技術(shù),實(shí)現(xiàn)高精度負(fù)載均衡、網(wǎng)絡(luò)層原生無(wú)損及低延遲。

程偉強(qiáng)介紹,全調(diào)度以太網(wǎng)(GSE)兩大模式,滿足所有智算組網(wǎng)場(chǎng)景:純網(wǎng)絡(luò)(N2N)方案交換設(shè)備需支持GSE核心能力,如GSE頭解封裝、多路分發(fā)、授權(quán)及排序等,網(wǎng)卡無(wú)感知;端網(wǎng)協(xié)同(E2E)方案交換設(shè)備能力弱化,負(fù)責(zé)多路分發(fā),GSE核心能力下沉至網(wǎng)卡。

程偉強(qiáng)進(jìn)一步介紹,GSE-N2N技術(shù)方案是基于報(bào)文容器的多路徑噴灑及DGSQ授權(quán)。程偉強(qiáng)解釋說(shuō),單流多路徑是提升網(wǎng)絡(luò)有效帶寬、降低網(wǎng)絡(luò)擁塞的關(guān)鍵手段,其核心是打破傳統(tǒng)流轉(zhuǎn)發(fā)粒度,在保證鏈路均衡性的前提下,充分利用網(wǎng)絡(luò)多路徑,同時(shí)減低端側(cè)處理亂序的壓力。

GSE E2E技術(shù)方案是基于報(bào)文容器的多路徑噴灑及亂序處理。在現(xiàn)有網(wǎng)絡(luò)報(bào)文級(jí)負(fù)載均衡且亂序交付方案中,由于接收端缺少報(bào)文到達(dá)的路徑信息,無(wú)法快速判丟;GSE的容器理念可為端側(cè)提供報(bào)文轉(zhuǎn)發(fā)的路徑信息,實(shí)現(xiàn)端側(cè)在亂序接收情況下的快速判斷。

截至目前,全調(diào)度以太網(wǎng)GSE1.0已經(jīng)正式商用于中國(guó)移動(dòng)智算中心(哈爾濱),GSE-N2N千卡集群正在試商用,GSE-E2E原型設(shè)備即將發(fā)布。程偉強(qiáng)透露,中國(guó)移動(dòng)已經(jīng)啟動(dòng)同廠家、異廠家千卡級(jí)GSE中試驗(yàn)證,配合九天、LLama-70B等大模型,驗(yàn)證GSE技術(shù)成熟性。GSE推進(jìn)計(jì)劃團(tuán)隊(duì)已經(jīng)完成三本技術(shù)標(biāo)準(zhǔn)的制定,并于9月底進(jìn)行正式發(fā)布。

智算中心互聯(lián):IP+光融合方案是重要技術(shù)方向

隨著AI大模型的發(fā)展,新型智算互聯(lián)業(yè)務(wù)不斷涌現(xiàn),以分布式訓(xùn)練、存算分離為代表的新型業(yè)務(wù)對(duì)網(wǎng)絡(luò)提出了更高要求。

面向AI大模型分布式訓(xùn)練需求及場(chǎng)景,超萬(wàn)卡級(jí)智算中心的電力供應(yīng)/機(jī)房空間等節(jié)點(diǎn)能力將成為建設(shè)瓶頸,智算中心分地域、分時(shí)期、分階段建設(shè)現(xiàn)象較為普遍,形成多個(gè)算力資源孤島,“可通過(guò)網(wǎng)絡(luò)能力整合多個(gè)集群,換取更大的集群規(guī)模。”程偉強(qiáng)說(shuō)。

面向分布式訓(xùn)練長(zhǎng)距離互聯(lián),其最大的挑戰(zhàn)是網(wǎng)絡(luò)時(shí)延增加(受限于物理極限)和互聯(lián)帶寬巨增(受限于建網(wǎng)成本),帶寬和時(shí)延的劣化,大幅降低集群有效算力,集群互聯(lián)獲得的規(guī)模效益降低,拉遠(yuǎn)算效目標(biāo)相比同局址不能低于80%(業(yè)界紅線)。

程偉強(qiáng)認(rèn)為,百公里城域跨園區(qū)互聯(lián)場(chǎng)景是一個(gè)技術(shù)問(wèn)題,電力緩解、網(wǎng)絡(luò)受限,通過(guò)大buffer路由器設(shè)備、高速以太網(wǎng)中長(zhǎng)距技術(shù),為AI大模型分布式訓(xùn)練提供更強(qiáng)大的算力。其中,IP+光融合方案有利于簡(jiǎn)化互聯(lián)設(shè)備形態(tài),降低功耗、尺寸、成本,實(shí)現(xiàn)統(tǒng)一管控運(yùn)維,是跨智算中心互聯(lián)IP廣域網(wǎng)的重要技術(shù)方向

千公里跨省多節(jié)點(diǎn)互聯(lián)場(chǎng)景是一個(gè)科學(xué)問(wèn)題,網(wǎng)絡(luò)、模型算法均受限,需要凝聚產(chǎn)學(xué)研用各方力量,共同攻關(guān)新大模型算法,新組網(wǎng)架構(gòu)、路由器緩存共享、大象流負(fù)載分擔(dān)、IP廣域擁塞控制等關(guān)鍵技術(shù),爭(zhēng)取形成全球領(lǐng)先的技術(shù)突破。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-09-12
中國(guó)移動(dòng)程偉強(qiáng):GSE兩大模式滿足所有智算組網(wǎng)場(chǎng)景需求
中國(guó)移動(dòng)程偉強(qiáng):GSE兩大模式滿足所有智算組網(wǎng)場(chǎng)景需求,C114訊 9月12日消息(九九)9月11-13日,第25屆中國(guó)國(guó)際光電博覽會(huì)在深圳舉行,在同期舉辦

長(zhǎng)按掃碼 閱讀全文