浪潮信息趙帥:未來一切計算皆AI,構(gòu)建開放算力模組規(guī)范至關(guān)重要

8月12日消息,2024開放計算中國峰會上,開放算力模組(OCM)規(guī)范正式啟動立項,首批成員包括中國電子技術(shù)標準化研究院、浪潮信息、Intel、AMD、百度、小紅書、聯(lián)想、超聚變等,旨在打造國內(nèi)首個服務器計算模組設計規(guī)范,構(gòu)建CPU統(tǒng)一算力底座。

開放計算模組規(guī)范(OCM) 規(guī)范的正式啟動,旨在建立基于處理器的標準化算力模組單元,通過統(tǒng)一不同處理器算力單元對外高速互連、管理協(xié)議、供電接口等,實現(xiàn)不同架構(gòu)處理器芯片兼容,構(gòu)建CPU的統(tǒng)一的算力底座,以解決CPU生態(tài)挑戰(zhàn)問題,方便客戶根據(jù)人工智能、云計算、大數(shù)據(jù)等多樣化應用場景,靈活、快速匹配最適合的算力平臺,推動算力產(chǎn)業(yè)高質(zhì)量快速發(fā)展。

為何要構(gòu)建“OCM”規(guī)范?

在談及“OCM”規(guī)范發(fā)起的初衷時,浪潮信息服務器產(chǎn)品線總經(jīng)理趙帥表示,現(xiàn)在,無論是手機、電腦、邊緣設備、CPU服務器、加速服務器都具有了AI計算的能力,也都在承載著多樣化的AI應用。AI算力已經(jīng)深入到千行百業(yè),滲透進每一個計算設備里,面向人工智能的算力范式不斷革新。通用算力也要具有AI計算的能力,可以說“未來一切計算皆AI”。

在智算時代背景下,CPU算力單元應用越來越豐富,除了大數(shù)據(jù)、關(guān)鍵計算、科學計算外,也要承擔AI應用的重要任務,這是CPU算力單元的重大機遇。

與此同時,隨著應用范式的多樣化,CPU呈現(xiàn)了多元化發(fā)展方向。目前x86、ARM、RISC-V等不同架構(gòu)的CPU處理器百花齊放,僅在中國,目前就有10多種CPU處理器,不同CPU協(xié)議標準不統(tǒng)一,系統(tǒng)功耗、總線速率、電流密度不斷提升,導致硬件開發(fā)、固件適配、部件測試資源等時間激增,給算力系統(tǒng)設計帶來巨大挑戰(zhàn)。

趙帥強調(diào):“需要構(gòu)建一個CPU的統(tǒng)一算力底座,解決CPU計算的效率問題。”

“OCM”規(guī)范的思路就是把原來一個緊耦合式的服務器架構(gòu)拆散,以CPU和內(nèi)存作為最小的算力單元,標準化高速和低速的互連接口。這樣,未來不同的算力平臺,只更換計算的模組,就可以實現(xiàn)從芯片到算力快速的落地應用。

通過這種標準化的算力模組,讓算力可以快速抵達用戶,讓用戶可以快速地利用最先進的算力。

“OCM”規(guī)范的價值和意義

浪潮信息服務器產(chǎn)品部產(chǎn)品規(guī)劃經(jīng)理羅劍認為,隨著OCM規(guī)范的啟動,對算力上游廠商、終端用戶、系統(tǒng)集成商都大有裨益。

對于上游廠商來說,這個規(guī)范可以讓他們在做處理器的同時,把這個算力模塊做出來,新的平臺可以快速地在系統(tǒng)上面去做集成。

對于終端用戶來說,這種標準化可以實現(xiàn)對多元算力的統(tǒng)一管理、統(tǒng)一運維,管理復雜性極大降低了。

對于系統(tǒng)集成商來說,算力標準化后,就可以在不同的系統(tǒng)里應用統(tǒng)一的算力模塊,類似于硬盤一樣,一個系統(tǒng)里面可以支持多家的硬盤,一樣的道理,未來一個系統(tǒng)里面就可以支持多元算力平臺。

事實上,這不是浪潮信息首次參與發(fā)起相關(guān)行業(yè)規(guī)范。此前,浪潮信息就參與和支持了針對超大規(guī)模深度學習訓練的AI加速卡的“開放加速規(guī)范OAM”。

“OAM”構(gòu)建了一個統(tǒng)一的加速芯片底座,解決了單個服務器內(nèi)多元AI加速卡形態(tài)和接口不統(tǒng)一,高速互連效率低,研發(fā)周期長等問題,促進了加速算力單元接口的統(tǒng)一和生態(tài)的完善。

目前開放計算規(guī)范OAM已成為全球最多高端AI加速芯片遵循的統(tǒng)一設計標準,全球20多家芯片企業(yè)支持開放加速規(guī)范,為AI芯片企業(yè)節(jié)省研發(fā)時間6個月以上,為整體產(chǎn)業(yè)研發(fā)投入節(jié)省數(shù)十億元,極大地降低了AI算力產(chǎn)業(yè)創(chuàng)新的難度,加速高質(zhì)量AI算力普惠發(fā)展。

浪潮信息最新一代基于OAM規(guī)范的AI服務器NF5698G7支持多種基于OAM規(guī)范的開放加速芯片,并為用戶構(gòu)建了一個千卡液冷集群,支持超千億參數(shù)量的AI大模型訓練。

目前,OAM規(guī)范還在持續(xù)迭代,未來基于OAM2.0規(guī)范的AI加速卡將支持1024張加速卡的卡間互聯(lián),突破大模型互聯(lián)瓶頸。

談到剛剛啟動的OCM規(guī)范,趙帥表示:“開放計算對于智算時代有非常重要的意義和價值,要用開放應對多元算力的挑戰(zhàn)。OCM是國內(nèi)首個服務器模組設計規(guī)范,希望更多的行業(yè)伙伴以及更多的用戶參與進來,真正讓多元的統(tǒng)一算力模組盡快地走進每一個用戶的機房當中。”

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-08-12
浪潮信息趙帥:未來一切計算皆AI,構(gòu)建開放算力模組規(guī)范至關(guān)重要
通用算力也要具有AI計算的能力,可以說“未來一切計算皆AI”。事實上,這不是浪潮信息首次參與發(fā)起相關(guān)行業(yè)規(guī)范。此前,浪潮信息就參與和支持了針對超大規(guī)模深度學習訓練的AI加速卡的“開放加速規(guī)范OAM”。浪潮信息最新一代基于OAM規(guī)范的AI服務器NF5698G7支持多種基于OAM規(guī)范的開放加速芯片,并為用戶構(gòu)建了一個千卡液冷集群,支持超千億參數(shù)量的AI大模型訓練。

長按掃碼 閱讀全文