9月25日消息(南山)隨著應用性能高要求和虛擬交換機性能限制的矛盾日益突出,使用智能網(wǎng)卡來代替?zhèn)鹘y(tǒng)網(wǎng)卡,成為ICT行業(yè)的研究熱點。浪潮作為國內(nèi)領(lǐng)先的服務(wù)器供應商,其對智能網(wǎng)卡的研究和應用值得業(yè)界關(guān)注。在今日舉辦的“2021中國智能網(wǎng)卡研討會”上,浪潮數(shù)據(jù)中心網(wǎng)絡(luò)市場總監(jiān)王昭峰介紹該公司智能網(wǎng)卡產(chǎn)品的創(chuàng)新和實踐。
王昭峰首先判斷,云計算的兩大特性是虛擬化和資源池化,智能網(wǎng)卡則加速了基礎(chǔ)設(shè)施的虛擬化和資源池化。隨著數(shù)據(jù)中心內(nèi)部數(shù)據(jù)和帶寬的爆炸式增長,傳統(tǒng)軟件實現(xiàn)虛擬化以及數(shù)據(jù)處理的方式遇到了一系列問題。智能網(wǎng)卡的出現(xiàn),將網(wǎng)絡(luò)、存儲以及安全任務(wù)從CPU卸載到了硬件進行加速,解決了在大帶寬場景下CPU的消耗以及延遲和抖動等問題。
目前,市場上主流的智能網(wǎng)卡硬件形式主要有四種,NP架構(gòu)、通用ASIC架構(gòu)(內(nèi)嵌ARM)、FPGA+SoC架構(gòu)、SoC和定制化ASIC架構(gòu),產(chǎn)品形態(tài)包括單卡、雙卡、OCP卡。王昭峰認為,幾種架構(gòu)沒有優(yōu)劣勢區(qū)分,差異在于性能可編程、功耗和成本之間的平衡,客戶基于這幾個方面的需求做選擇。
浪潮在智能網(wǎng)卡解決方案上選擇了FPGA+CPU架構(gòu)。“為什么選擇這個方案?一是高性能,F(xiàn)PGA提供了接近ASIC的處理能力。二是軟硬件全可編程,產(chǎn)品設(shè)計更靈活,更能滿足客戶業(yè)務(wù)的實際演進。”王昭峰表示,浪潮將IO設(shè)備硬件虛擬化,在網(wǎng)絡(luò)、存儲、安全方面做到了硬件加速卸載,客戶也可以基于智能網(wǎng)卡逐步去做管理平面卸載。
王昭峰說,虛擬設(shè)備硬件化帶來兩個問題,第一個如何管理虛擬化設(shè)備,二是熱遷移。
浪潮一是SR-IOV引入了兩種PCIe的Function,即PF和VF,通常對應著裸金屬和虛擬機的應用場景。在虛擬機場景下,VF的配置和管理由VMM完成,Guest OS需要支持VF的動態(tài)熱插拔;在裸金屬場景下,PF的配置和管理由網(wǎng)卡SoC上管理程序負責,Host OS需要支持PF的動態(tài)熱插拔。
二是基于VDPA的熱遷移方案優(yōu)化,在感知硬件設(shè)備狀態(tài)上,VDPA控制和數(shù)據(jù)平面分離,在監(jiān)控設(shè)備狀態(tài)同時,提升轉(zhuǎn)發(fā)性能。在遷移過程中跟蹤臟頁,采用網(wǎng)卡硬件監(jiān)控DMA頁的跟蹤,避免Host軟件處理引發(fā)遷移過程中的性能下降。
王昭峰還談到了智能網(wǎng)卡與服務(wù)器的適配。智能網(wǎng)卡是大server的“小server”,擁有一套小系統(tǒng),如何管理適配,體現(xiàn)在四個方面:供電、監(jiān)控、管理、測試。
供電方面,小于75W的智能網(wǎng)卡,采用金手指方式供電;大于75W的智能網(wǎng)卡,采用金手指+外接電源的方式供電。
監(jiān)控方面,智能網(wǎng)卡是個獨立運行的小系統(tǒng),需要像管理服務(wù)器一樣,監(jiān)控整個網(wǎng)卡的硬件狀態(tài),記錄異常日志、診斷分析故障、以及遠程固件升級等。浪潮采用獨立的BMC監(jiān)管設(shè)計,既可以解決監(jiān)控管理需求,又可以避免服務(wù)器側(cè)的軟硬件修改。
管理方面,智能網(wǎng)卡和服務(wù)器的管理拓撲分為兩種:內(nèi)部互聯(lián)和外部互聯(lián)。內(nèi)部互聯(lián),通過UART、金手指的I2C以及NCSI,Host BMC與網(wǎng)卡BMC互聯(lián),兩者為主從關(guān)系;外部互聯(lián),通過網(wǎng)卡和服務(wù)器的網(wǎng)口互聯(lián),Host BMC與網(wǎng)卡BMC相互獨立,分開管理。
測試方面,浪潮開發(fā)服務(wù)器時會引入多品牌智能網(wǎng)卡,因此總結(jié)了一套完善的硬件功能測試和軟件功能測試規(guī)范,包括基本功能、卸載功能、自定義擴展功能、應用測試、兼容性測試等。
最后,在智能網(wǎng)卡的應用實踐上,浪潮一方面是配合浪潮云探索虛擬機和裸金屬虛擬化方案,另一方面是在數(shù)據(jù)中心網(wǎng)絡(luò)應用探索。王昭峰指出,帶寬增長將在達到51.2T后逐步放緩,屆時網(wǎng)絡(luò)訴求會發(fā)生變化,從以帶寬為中心到以延時為中心。浪潮結(jié)合智能網(wǎng)卡以及網(wǎng)絡(luò)設(shè)備,通過狀態(tài)可視收集實現(xiàn)數(shù)據(jù)中心可視化方案,包含了業(yè)務(wù)流量、虛擬網(wǎng)絡(luò)以及物理網(wǎng)絡(luò),通過動態(tài)感知調(diào)整網(wǎng)絡(luò)參數(shù)。
- 2025年十大技術(shù)創(chuàng)新
- 2025年可能面臨的五大網(wǎng)絡(luò)安全威脅
- 什么是大型語言模型(LLM)?| 智能百科
- 2025年的主要數(shù)據(jù)工程趨勢
- 智能、互聯(lián)的建筑正在塑造未來的城市
- 人工智能時代的數(shù)據(jù)工程:機遇與挑戰(zhàn)
- 數(shù)據(jù)可觀察性2.0:超越傳統(tǒng)監(jiān)測,推動企業(yè)數(shù)據(jù)質(zhì)量革命
- 隨著人工智能代理的出現(xiàn),結(jié)構(gòu)化數(shù)據(jù)再次流行起來|觀點
- 有源電纜(AEC)對光模塊更換的影響
- 一根光纖,多種轉(zhuǎn)變
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。