開放兼容,聯(lián)合創(chuàng)新:新華三加速LPO規(guī)模商用

9月20日消息(水易)大模型訓(xùn)練需要大算力的支撐,GPU性能迭代也隨之加速。即便如此,單片GPU的性能永遠(yuǎn)無法跟上大模型的需求,智算集群成為必選項(xiàng),千卡已是常態(tài),萬卡如火如荼,十萬卡成為目標(biāo)。同時(shí),為充分發(fā)揮每一分算力的效能,智算網(wǎng)絡(luò)的技術(shù)演進(jìn)成為關(guān)鍵。

這一輪智算網(wǎng)絡(luò)建設(shè),為滿足大模型更大數(shù)據(jù)量、更快速度的計(jì)算任務(wù),更高端口速率和交換容量的交換機(jī)成為剛需,隨之也帶來了能耗挑戰(zhàn)。目前已有專家指出,以電力為代表的能源可能成為掣肘智算中心建設(shè)的瓶頸。

數(shù)據(jù)顯示,在網(wǎng)絡(luò)設(shè)備中,以光模塊為代表的關(guān)鍵器件是能耗大戶,為了實(shí)現(xiàn)高速傳輸與低功耗之間的平衡,LPO等光互連技術(shù)受到重視,已經(jīng)有頭部互聯(lián)網(wǎng)企業(yè)開始試點(diǎn)部署,展現(xiàn)了良好的光鏈路性能。

作為致力于推動(dòng)標(biāo)準(zhǔn)化聯(lián)接促進(jìn)智算網(wǎng)絡(luò)創(chuàng)新的“領(lǐng)頭羊”,新華三基于400G智算交換機(jī)與十余家模塊廠商的DSP&LPO模塊現(xiàn)場互聯(lián)測試,良好的測試結(jié)果充分體現(xiàn)了新華三智算交換機(jī)的穩(wěn)定性與兼容性,基于光互連技術(shù)為智算網(wǎng)絡(luò)建設(shè)提速、降耗,全面賦能AI產(chǎn)業(yè)高速發(fā)展。

聯(lián)調(diào):促進(jìn)LPO技術(shù)驗(yàn)證

從光模塊的技術(shù)演進(jìn)來看,隨著速率的不斷提升,為確保信號(hào)在傳輸過程中的準(zhǔn)確性和可靠性,業(yè)界通過引入DSP芯片,對本端/多端的交換機(jī)電信號(hào)進(jìn)行整形重塑,降低誤碼率。因此在高速光模塊內(nèi)部,DSP一直是必備器件。

不過,DSP的不足之處就是成本高、功耗大,統(tǒng)計(jì)顯示,傳統(tǒng)DSP芯片方案會(huì)占模塊50%以上的功耗。光模塊速率的不斷提升,功耗也會(huì)數(shù)量級(jí)的攀升,對智算中心帶來極大的技術(shù)挑戰(zhàn),也與綠色低碳的發(fā)展理念相悖。

如何降低光模塊功耗,最直接的手段就是去掉或減少DSP在光模塊內(nèi)部的使用。LPO去掉了傳統(tǒng)DSP模塊中的DSP芯片,利用交換機(jī)芯片進(jìn)行電信號(hào)的處理。同時(shí),LPO仍然保持可插拔模塊形態(tài),可重用現(xiàn)有成熟的部分光模塊產(chǎn)業(yè)鏈,最大限度的實(shí)現(xiàn)低功耗、低時(shí)延、低成本和高可靠。

綜合來看,LPO是一個(gè)綠色節(jié)能的技術(shù),業(yè)界也認(rèn)為400G/800G周期的下一波需求將會(huì)是LPO,解決的重點(diǎn)就是功耗挑戰(zhàn)。不過,真正落地還有一系列的挑戰(zhàn),首先是標(biāo)準(zhǔn),LPO由于無DSP,互操作性存在挑戰(zhàn),目前產(chǎn)業(yè)界已經(jīng)發(fā)起LPO MSA,建立相關(guān)標(biāo)準(zhǔn)規(guī)范。

更為重要的是如何確保以上提到的效果能實(shí)現(xiàn)。今年的CIOE中國光博會(huì)期間,某頭部測試測量廠商在接受C114專訪時(shí)談到,LPO將光模塊DSP拿掉之后,將會(huì)強(qiáng)烈依賴交換機(jī)芯片SerDes,這對測試策略產(chǎn)生巨大的影響,LPO如何對標(biāo)交換機(jī)的性能指標(biāo),是最大的挑戰(zhàn)。

新華三認(rèn)為,LPO模塊需要和設(shè)備聯(lián)合起來,才能真正實(shí)現(xiàn)LPO所帶來的效果。新華三同鈞恒科技進(jìn)行聯(lián)合400G QSFP112 LPO開發(fā),通過模塊底層光電芯片合理選型、SI仿真優(yōu)化、系統(tǒng)級(jí)參數(shù)調(diào)優(yōu)、完善的測試策略,充分保證了LPO模塊與交換機(jī)的良好適配和快速部署。

兼容加速LPO規(guī)模商用

當(dāng)然,聯(lián)合開發(fā)并不意味著只能適配某一特定廠商的模塊。此次新華三作為設(shè)備廠商,同時(shí)跟十余家光模塊廠商完成了DSP&LPO模塊現(xiàn)場互聯(lián)測試,這是國內(nèi)第一次交換機(jī)設(shè)備與十多家光模塊的批量實(shí)測,充分體現(xiàn)了新華三在生態(tài)合作方面的廣度。

值得一提的是,考慮到前文提到了聯(lián)合調(diào)優(yōu)的重要性,新華三還打造了多種智能軟件調(diào)優(yōu)方案,助力不同廠商的LPO模塊與新華三主機(jī)的適配調(diào)優(yōu),以實(shí)現(xiàn)更良好的兼容性,為不同端口走線的LPO模塊提供良好的電信號(hào)驅(qū)動(dòng)能力。

據(jù)了解,在本次DSP&LPO模塊互聯(lián)測試中,數(shù)據(jù)顯示不同廠商的LPO模塊在H3C S9827上的誤碼率均低于IEEE定義的門限要求,且經(jīng)過與主機(jī)適配調(diào)優(yōu)后的LPO模塊具有更好的性能參數(shù)、誤碼率更貼近DSP模塊,也進(jìn)一步說明主機(jī)與LPO適配的重要性。

不止于此,新華三智算交換機(jī)的產(chǎn)品布局豐富,H3C S9827系列能夠?qū)崿F(xiàn)對各廠家的不同模塊規(guī)格(VR4、DR4等)、不同芯片方案(DSP、LPO)、不同激光器方案(EML、硅光)、多種應(yīng)用模式(一對一、一分二)的QSFP112模塊的類型讀取,可靈活智能識(shí)別端口模塊模式。

回頭看LPO技術(shù)的初衷,尋找高速傳輸與低功耗之間的平衡。更高速率在短期內(nèi)挑戰(zhàn)不大,難的是低功耗。目前業(yè)界對于綠色光互連技術(shù)探索主要從光模塊功耗、網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)以及系統(tǒng)散熱方案三方面入手。

LPO是業(yè)界對于降低光模塊功耗的探索,而從系統(tǒng)散熱的角度看,今年的CIOE中國光博會(huì)期間,C114也看到頭部光模塊廠商都推出了相應(yīng)的浸沒式液冷方案,多管齊下滿足智算中心低功耗的需求。

新華三積極探索與實(shí)踐多樣化的節(jié)能降耗策略,將綠色低碳理念融入交換機(jī)產(chǎn)品研發(fā)設(shè)計(jì)當(dāng)中,H3C S9827系列不僅支持全端口LPO可插拔模塊應(yīng)用,還具備風(fēng)冷液冷兼容設(shè)計(jì),通過LPO與液冷技術(shù)的融合,實(shí)現(xiàn)整機(jī)功耗降低25%~40%,滿足PUE≤1.14的要求。

開放踐行標(biāo)準(zhǔn)化聯(lián)接

回到文章開頭提到的智算網(wǎng)絡(luò)的創(chuàng)新變革,新華三始終倡導(dǎo)標(biāo)準(zhǔn)化聯(lián)接,創(chuàng)新性提出“算力×聯(lián)接”的理念,通過開放、標(biāo)準(zhǔn)的聯(lián)接技術(shù),構(gòu)建開放多元的智算生態(tài),滿足人工智能應(yīng)用對海量多元異構(gòu)算力的需求。

光模塊是其中智算網(wǎng)絡(luò)的“關(guān)鍵環(huán)節(jié)”之一,也是智算生態(tài)產(chǎn)業(yè)中的一環(huán),本次與十余家光模塊廠商的現(xiàn)場實(shí)測,進(jìn)一步證明了新華三交換機(jī)具備標(biāo)準(zhǔn)開放的特性。另外,與鈞恒科技聯(lián)合研發(fā)的LPO模塊,其內(nèi)部的兼容設(shè)計(jì)允許多芯片方案并行開發(fā)和驗(yàn)證。

據(jù)悉,在追求高效率、高能效、低功耗的AI智算應(yīng)用的解決方案的道路上,新華三持續(xù)精進(jìn),在當(dāng)下趨于成熟化的400G LPO解決方案的火熱探討中,新華三也已具備800G LPO的高密智算交換機(jī),以前瞻性視角推動(dòng)智算網(wǎng)絡(luò)的發(fā)展。

除了創(chuàng)新的LPO交換機(jī)產(chǎn)品外,新華三打造的算力集群核心交換機(jī)H3C S12500 AI將傳統(tǒng)框式設(shè)備的控制引擎、交換網(wǎng)板、業(yè)務(wù)板卡分別獨(dú)立為盒式設(shè)備,通過高速光模塊互聯(lián),滿足靈活組網(wǎng)需求,斬獲第八屆未來網(wǎng)絡(luò)大會(huì)“創(chuàng)新科技成果獎(jiǎng)”殊榮。

與此同時(shí),新華三還推出了《智算網(wǎng)絡(luò)異構(gòu)連通專項(xiàng)測試》標(biāo)準(zhǔn),現(xiàn)已完成包括GPU、光模塊、網(wǎng)卡等在內(nèi)等全異構(gòu)硬件平臺(tái)連通性驗(yàn)證,以及不同技術(shù)方案間的聯(lián)調(diào)適配,進(jìn)一步推動(dòng)國內(nèi)智算產(chǎn)業(yè)的生態(tài)協(xié)作。

面向未來,新華三也將持續(xù)與更多的光模塊廠商合作,打造開放市場生態(tài),共研高品質(zhì)模塊組件,為客戶提供從主機(jī)到互連組件的高可靠性、高穩(wěn)定性、高兼容性的全套方案產(chǎn)品,促進(jìn)光通信產(chǎn)業(yè)的發(fā)展,滿足人工智能應(yīng)用對算力的需求,為百行百業(yè)的數(shù)智發(fā)展注入強(qiáng)勁動(dòng)能。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-09-20
開放兼容,聯(lián)合創(chuàng)新:新華三加速LPO規(guī)模商用
開放兼容,聯(lián)合創(chuàng)新:新華三加速LPO規(guī)模商用,C114訊 9月20日消息(水易)大模型訓(xùn)練需要大算力的支撐,GPU性能迭代也隨之加速。即便如此,單

長按掃碼 閱讀全文