釋放 AI 潛能,Arm 計算平臺構(gòu)建計算與存儲的未來

作者:Arm物聯(lián)網(wǎng)事部業(yè)務(wù)拓展副總裁 馬健

當(dāng)下,我們正處在激動人心的人工智能(AI)技術(shù)變革初期階段。隨著自然語言、多模態(tài)大模型以及生成式AI技術(shù)的加速演進(jìn),AI正以前所未有的速度重塑各行各業(yè)。根據(jù)IDC的預(yù)測,全球數(shù)據(jù)量將從2024年的159.2ZB增長到2028年的超過384.6ZB,年復(fù)合增長率達(dá)24.4%。其中,到2028年,預(yù)計37%的數(shù)據(jù)將會在云端直接產(chǎn)生,而其余數(shù)據(jù)會從邊緣端和終端直接產(chǎn)生。

面對邊緣數(shù)據(jù)的激增,高效的數(shù)據(jù)處理、低延遲傳輸以及智能、安全的存儲正成為行業(yè)關(guān)注的重點(diǎn)。未來的計算架構(gòu)不僅要提供更強(qiáng)的算力,還必須更緊密地與存儲系統(tǒng)結(jié)合,以確保AI模型能夠高效運(yùn)行,同時優(yōu)化數(shù)據(jù)管理和訪問方式。

從目前的AI技術(shù)發(fā)展方向來看,一方面,大模型正向通用人工智能(AGI)演進(jìn),探索多模態(tài)、物理AI等新方向,并持續(xù)挑戰(zhàn)算力的新極限。另一方面,為推進(jìn)大模型全面部署的進(jìn)程,行業(yè)開始邁向深度優(yōu)化和垂直領(lǐng)域定制化,使大模型能走入千行百業(yè),適應(yīng)移動端、邊緣計算、云端部署等不同場景。

DeepSeek的推出對全球AI市場產(chǎn)生了深遠(yuǎn)影響:作為一種開放的創(chuàng)新技術(shù),它不僅展示了AI在訓(xùn)練與推理過程中的優(yōu)化潛力,還極大提高了大規(guī)模部署的效率,充分證明了模型能夠在更低成本、更高效能的環(huán)境中穩(wěn)定運(yùn)行。這一成就對于推動AI在企業(yè)級應(yīng)用和邊緣計算領(lǐng)域的大規(guī)模應(yīng)用具有重要意義。

Arm計算平臺:持續(xù)促進(jìn)從云到端的AI優(yōu)化部署

在AI發(fā)展的初期階段,數(shù)據(jù)中心作為模型訓(xùn)練和初期推理的核心場所,正面臨著前所未有的挑戰(zhàn)。傳統(tǒng)的標(biāo)準(zhǔn)通用芯片在處理計算密集型的AI工作負(fù)載時顯得力不從心,無法滿足AI時代對于高性能、低功耗以及靈活擴(kuò)展性的迫切需求。在此背景下,Arm計算平臺憑借其先進(jìn)的技術(shù)優(yōu)勢,為新一代AI云基礎(chǔ)設(shè)施的發(fā)展開辟了新的范式。從Arm Neoverse計算子系統(tǒng)(CSS)、Arm Total Design生態(tài)項目到芯粒系統(tǒng)架構(gòu)(CSA),Arm進(jìn)行了從技術(shù)到生態(tài)的整體化布局,不僅為AI數(shù)據(jù)中心的工作負(fù)載提供了高效、靈活且可擴(kuò)展的解決方案,還幫助合作伙伴專注于產(chǎn)品差異化,為產(chǎn)品上市進(jìn)程提速。

AI推理是AI釋放價值的關(guān)鍵,它正迅速從云端拓展至邊緣端,覆蓋世界的每一個角落。在邊緣AI領(lǐng)域,Arm憑借其技術(shù)與生態(tài)的獨(dú)特優(yōu)勢,不斷創(chuàng)新,確保智能物聯(lián)網(wǎng)與消費(fèi)電子生態(tài)系統(tǒng)能在恰當(dāng)?shù)臅r機(jī)、于最適合的地點(diǎn)執(zhí)行最優(yōu)工作負(fù)載。

為了滿足邊緣AI日益攀升的AI工作負(fù)載需求,Arm近期發(fā)布了以全新Armv9超高能效CPU Cortex-A320以及對Transformer網(wǎng)絡(luò)具有原生支持的Ethos-U85 AI加速器為核心的邊緣AI計算平臺。該平臺實(shí)現(xiàn)了CPU與AI加速器的深度集成。相比去年以Cortex-M85搭配Ethos-U85的平臺提升了八倍的機(jī)器學(xué)習(xí)(ML)計算性能,帶來了顯著的AI計算能力突破,可賦能邊緣AI設(shè)備輕松運(yùn)行超過10億參數(shù)的大模型。

釋放 AI 潛能,Arm 計算平臺構(gòu)建計算與存儲的未來

圖:Arm邊緣AI計算平臺支持運(yùn)行超10億參數(shù)的端側(cè)AI模型

其中,全新發(fā)布的超高能效Cortex-A320不僅可以為Ethos-U85提供更高的內(nèi)存容量與帶寬,讓大模型在Ethos-U85上的執(zhí)行如虎添翼,還支持更大的可尋址內(nèi)存空間,并能夠更靈活地管理多層次內(nèi)存訪問延遲。Cortex-A320與Ethos-U85的組合,是運(yùn)行大模型及應(yīng)對邊緣AI任務(wù)所帶來的內(nèi)存容量及帶寬挑戰(zhàn)的理想選擇。

此外,Cortex-A320還充分利用了Armv9增強(qiáng)的AI計算特性以及包括Secure EL2、指針驗證/分支目標(biāo)識別(PACBTI)以及內(nèi)存標(biāo)記擴(kuò)展(MTE)等在內(nèi)的安全特性。此前,這些特性已經(jīng)在其他市場得到廣泛應(yīng)用,而Arm現(xiàn)在將其引入了物聯(lián)網(wǎng)與邊緣AI計算領(lǐng)域,在提供出色且靈活A(yù)I性能的同時,實(shí)現(xiàn)對軟件負(fù)載更好的隔離與軟件內(nèi)存異常的防護(hù),提高整體系統(tǒng)安全性。

AI時代的存儲發(fā)展:存儲、計算和安全能力的全面升級

隨著AI計算需求的持續(xù)增長,云邊端在對計算能力提出更高要求的同時,也對存儲系統(tǒng)的性能、密度、實(shí)時性和功耗等方面提出了更嚴(yán)苛的要求。在傳統(tǒng)模式下,計算架構(gòu)往往將存儲和計算相對分離,存儲設(shè)備僅僅承擔(dān)數(shù)據(jù)存放的角色,數(shù)據(jù)需要在存儲與計算節(jié)點(diǎn)之間頻繁搬移,導(dǎo)致“存儲-計算”之間的瓶頸。然而在AI時代,為滿足數(shù)據(jù)實(shí)時分析、智能管理及高效訪問等需求,將存儲置于離計算單元更近的地方,或讓存儲本身具備計算能力,變得尤為關(guān)鍵。這樣能夠確保AI任務(wù)在最合適的位置得到高效執(zhí)行。

從云到端的AI計算,對存儲吞吐量、延遲、能耗、安全以及諸如Open Channel等提升主機(jī)可管理性(host manageability)的需求都不盡相同。存儲控制器以及運(yùn)行在存儲控制器中Arm CPU上的固件在支持差異化AI存儲需求中起到了極其重要的作用。

釋放 AI 潛能,Arm 計算平臺構(gòu)建計算與存儲的未來

圖:Arm豐富的IP平臺解決方案為AI存儲提供領(lǐng)先的性能及能效

事實(shí)上,作為數(shù)據(jù)存儲與網(wǎng)絡(luò)控制的基石,Arm一直在為全球存儲控制器和設(shè)備提供高性能、低功耗、安全可靠的解決方案,其中包括:

·Arm Cortex-R系列實(shí)時處理器擁有最快的中斷延時和實(shí)時反應(yīng)速度,被廣泛應(yīng)用于諸多存儲設(shè)備;

·Arm Cortex-M系列嵌入式處理器是后端閃存和媒體控制的熱門選擇,并支持自定義指令,客戶可以針對獨(dú)特NAND介質(zhì)的深度優(yōu)化來創(chuàng)造差異;

·Arm Cortex-A系列應(yīng)用處理器以高吞吐量流水線設(shè)計、支持最高處理性能,同時擁有ML、數(shù)據(jù)處理軟件和豐富操作系統(tǒng)的堅實(shí)生態(tài)支持;

·Arm Ethos-U AI加速器支持每秒2048MACs的Transformer原生加速,可以助力存儲控制器本身變得更智能;

·此外,還有為數(shù)據(jù)中心量身定制的Neoverse。我們已開始看到CXL(Compute Express Link)方面的創(chuàng)新設(shè)計采用Arm Coherent Mesh Network (CMN)與Neoverse組合實(shí)現(xiàn)可“組成式”內(nèi)存擴(kuò)展,并融入近存儲計算的理念,減少數(shù)據(jù)搬運(yùn)。

生態(tài)攜手,構(gòu)建AI計算與存儲未來

在專注提供領(lǐng)先的技術(shù)和產(chǎn)品的同時,Arm還致力于和生態(tài)系統(tǒng)合作伙伴攜手共進(jìn),共同推動存儲產(chǎn)業(yè)的發(fā)展?;贏rm架構(gòu)的平臺正被行業(yè)領(lǐng)先的存儲企業(yè)廣泛采用,以優(yōu)化其存儲解決方案。例如,Solidigm公司最新發(fā)布的122TB PCIe SSD Solidigm™ D5-P5336顯著提升了AI數(shù)據(jù)中心的能效、存儲密度和性能,其存儲控制器采用Arm Cortex-R CPU,有效提升了讀寫的實(shí)時性和延時確定性;慧榮科技(Silicon Motion)面向AI PC的SM2508主控芯片采用了Arm Cortex-R8與Cortex-M0,在能效和數(shù)據(jù)吞吐上實(shí)現(xiàn)了突破,其SM2264XT-AT是業(yè)界首款車用PCIe Gen4主控芯片,通過增強(qiáng)的虛擬化來支持混合關(guān)鍵性工作負(fù)載對數(shù)據(jù)的訪問,并可節(jié)省30%的能耗;江波龍基于Arm Cortex-R CPU打造的XP2300、ORCA 4836以及UNCIA 3836固態(tài)硬盤,憑借其大容量與高性能的優(yōu)勢,廣泛應(yīng)用于AI PC、服務(wù)器、云計算、分布式存儲及邊緣計算等多個應(yīng)用場景,滿足AI技術(shù)的本地化部署需求。

此外,在本土存儲市場,大普微、聯(lián)蕓科技、憶芯科技、特納飛、得一微電子、英韌科技等領(lǐng)先的存儲企業(yè),也都廣泛采用Arm技術(shù)打造SSD主控芯片與設(shè)備方案。

迄今為止,基于Arm架構(gòu)和平臺所應(yīng)用的存儲設(shè)備已近200億臺,其中包括云和企業(yè)級SSD、車載SSD、消費(fèi)級SSD、硬盤驅(qū)動器和嵌入式閃存設(shè)備。目前,由Arm技術(shù)賦能的存儲設(shè)備持續(xù)保持在每日大約300萬臺的出貨量。

憑借前沿的技術(shù)實(shí)力、豐富的生態(tài)布局、深厚的存儲行業(yè)積累,Arm正繼續(xù)引領(lǐng)技術(shù)創(chuàng)新,賦能AI時代的計算與存儲發(fā)展。Arm也將繼續(xù)與合作伙伴攜手,通過安全、高效的Arm計算平臺,構(gòu)建AI時代計算與存儲的新未來。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )