中國電信李俊杰:DCN高速光互聯(lián)提速AI大模型訓(xùn)練,AI賦能光網(wǎng)智慧運營

9月7日消息(水易)第24屆中國國際光電博覽會(CIOE)如期召開,在同期舉辦的“算力網(wǎng)絡(luò)與光技術(shù)發(fā)展論壇”上,中國電信光傳輸專業(yè)首席專家李俊杰表示,AI時代,數(shù)據(jù)中心已成為網(wǎng)絡(luò)流量的中心,也是光網(wǎng)絡(luò)建設(shè)的中心。

特別是隨著ChatGPT的爆火,人們逐漸意識到,模型參數(shù)規(guī)模與性能提升后,AI大模型訓(xùn)練對于網(wǎng)絡(luò)的需求相比于傳統(tǒng)模型也隨之產(chǎn)生變化。對比現(xiàn)在緊缺的A100和A800的性能參數(shù),A800被限制的是互聯(lián)帶寬,而不是算力。

“大模型訓(xùn)練需要大規(guī)模集群算力的保障,網(wǎng)絡(luò)帶寬和性能限制影響集群算力的發(fā)揮。”李俊杰表示,因此在AI時代,進(jìn)一步加強了對網(wǎng)絡(luò)質(zhì)量的要求,尤其是數(shù)據(jù)中心內(nèi)部組網(wǎng)要求大規(guī)模、高帶寬、低時延、零丟包。

DCN高速光互聯(lián)是剛需

對于大模型的發(fā)展,國內(nèi)已是“百模”大戰(zhàn)之勢?!吨袊?a href="http://picoinsstore.com/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD_1.html" target="_blank" class="keylink">人工智能大模型地圖研究報告》數(shù)據(jù)顯示,截至5月底,中國已經(jīng)發(fā)布了79個大模型(10億參數(shù)以上)。

“百模”大戰(zhàn)帶來了數(shù)據(jù)中心流量的進(jìn)一步升級,數(shù)通光模塊正逐漸實現(xiàn)100G-400G-800G三級跳躍。數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)(DCN)傳輸距離普遍在2km以內(nèi),考慮低成本IM-DD方案;數(shù)據(jù)中心間互聯(lián)(DCI)則必須使用相干(ZR/ZR+)。

在李俊杰看來,相對于數(shù)據(jù)中心互聯(lián)(DCI)網(wǎng)絡(luò),數(shù)據(jù)中心內(nèi)部(DCN)網(wǎng)絡(luò)面臨的挑戰(zhàn)更大,但機遇也更多。目前面向DCN的400G光模塊已日趨成熟,且標(biāo)準(zhǔn)完備。800G預(yù)計即將進(jìn)入數(shù)通市場,相關(guān)標(biāo)準(zhǔn)仍在制定中,未正式發(fā)布,其中2km內(nèi)光模塊將成為DC內(nèi)主流。

不過,隨著速率的不斷提升,功耗和200Gb/s+ CEI電接口成為瓶頸。在主流設(shè)備商、互聯(lián)網(wǎng)廠商、光模塊廠商的推動下,CPO光電合封技術(shù)成為熱點, OIF等標(biāo)準(zhǔn)化組織也在積極推進(jìn)CPO光模塊技術(shù)標(biāo)準(zhǔn)。

李俊杰指出,CPO能夠顯著降低功耗,降低電信號傳輸距離,提供信號質(zhì)量;與可插拔相比,提高ASIC-光模塊互聯(lián)密度,高集成,節(jié)省空間。不過CPO相對依賴硅光子技術(shù)才能做到小型化高集成,需要借助硅光的工藝和封裝測試平臺;另外,更復(fù)雜的技術(shù)是否能帶來收益,目前可插拔方案能耗問題還能應(yīng)對,沒到非用不可的地步。

在此背景下,LPO“線性直驅(qū)”成為新勢力。李俊杰介紹,LPO仍使用傳統(tǒng)光模塊封裝,DSP被放在設(shè)備側(cè),非線性信號處理由設(shè)備實現(xiàn),模塊只處理線性信號,這種方式降低了光模塊功耗和成本。

據(jù)了解,進(jìn)入2023年以來,“線性直驅(qū)”已經(jīng)開始影響產(chǎn)業(yè)界。今年3月,IPEC聯(lián)合Lightcounting舉辦了關(guān)于線性直驅(qū)技術(shù)的線上研討會;今年OFC上,模塊和芯片廠商聯(lián)合打造了112G Linear的樣機demo,OIF也在討論CEI-112G-Linear電氣標(biāo)準(zhǔn)。國內(nèi)去年9月,由OTT牽頭在ODCC發(fā)布相關(guān)白皮書。

值得一提的是,全光交換技術(shù)開始走入數(shù)據(jù)中心。李俊杰介紹,先驅(qū)者已經(jīng)將光線路交換(基于MEMS的OCS)引入DCN,展現(xiàn)了成本、功耗、時延等多方面優(yōu)勢,但是需要架構(gòu)性創(chuàng)新。“光線路交換技術(shù)進(jìn)入數(shù)據(jù)中心內(nèi)部是必然趨勢,光波長交換技術(shù)的應(yīng)用值得研究。”

AI賦能光網(wǎng)絡(luò)智慧運營

發(fā)展AI大模型的主要目的是加速千行百業(yè)數(shù)字化轉(zhuǎn)型升級。因此光網(wǎng)絡(luò)技術(shù)的升級在推動AI大模型訓(xùn)練高效可靠的同時,反過來AI技術(shù)和能力的持續(xù)提升,也將有效賦能光網(wǎng)絡(luò)智慧運營。

李俊杰指出,光網(wǎng)絡(luò)向超大容量、全光交換、超長距離、超大組網(wǎng)持續(xù)演進(jìn)的同時,智慧運營也是光網(wǎng)絡(luò)發(fā)展的必然趨勢。

回顧光網(wǎng)絡(luò)智能化的進(jìn)程,從傳統(tǒng)的人工運維,到逐步引入電層ASON、光層WSON,再到后來的SDN化實現(xiàn)集中管控和能力開放。如今已經(jīng)邁入智能化,李俊杰介紹,目前AI技術(shù)已經(jīng)在流量預(yù)測、態(tài)勢感知、故障溯源等多個場景展現(xiàn)了其價值。

在客戶流量預(yù)測場景,針對不同政企OTN用戶,實現(xiàn)對指定時段流量值的預(yù)測分析,現(xiàn)網(wǎng)數(shù)據(jù)(基于電信自研UMS控制器采集)驗證,預(yù)測準(zhǔn)確度可達(dá)90%以上。“結(jié)合歷史數(shù)據(jù),分析預(yù)測未來的流量趨勢,對路由選擇、擴容建設(shè)等有指導(dǎo)意義。”

網(wǎng)絡(luò)態(tài)勢感知場景,通過光纖傳感+AI算法,識別不同振動模式,提前預(yù)警光纜外破風(fēng)險;通過光纖傳感+智能識別算法,檢測光纜同溝同纜風(fēng)險。“引入AI,對各類破壞事件展開準(zhǔn)確定位,快速精準(zhǔn)指導(dǎo)搶修工作,提升運維效率。”

面向未來,數(shù)字孿生、大模型都將助力實現(xiàn)智能光網(wǎng)絡(luò)。數(shù)字孿生以數(shù)字化方式在物理網(wǎng)絡(luò)上建立一個鏡像數(shù)字網(wǎng)絡(luò),實時反映網(wǎng)絡(luò)資源的狀態(tài)以及業(yè)務(wù)的運行狀態(tài)。對于大模型,高質(zhì)量的數(shù)據(jù)是大模型發(fā)揮價值的基礎(chǔ),運營商若希望借助AI提升智慧運營能力,首先需要大力夯實自主掌控的數(shù)據(jù)基礎(chǔ)。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-09-07
中國電信李俊杰:DCN高速光互聯(lián)提速AI大模型訓(xùn)練,AI賦能光網(wǎng)智慧運營
中國電信李俊杰:DCN高速光互聯(lián)提速AI大模型訓(xùn)練,AI賦能光網(wǎng)智慧運營,C114訊 9月7日消息(水易)第24屆中國國際光電博覽會(CIOE)如期召開,在同期舉辦的算力網(wǎng)絡(luò)

長按掃碼 閱讀全文