對于人工智能(AI)而言,任何單一硬件或計算組件都無法成為適合各類工作負載的萬能解決方案。AI貫穿從云端到邊緣側(cè)的整個現(xiàn)代計算領(lǐng)域,為了滿足不同的AI用例和需求,一個可以靈活使用CPU、GPU和NPU等不同計算引擎的異構(gòu)計算平臺必不可少。
依托于Arm CPU的性能、能效、普及性、易于編程性和靈活性,從小型的嵌入式設(shè)備到大型的數(shù)據(jù)中心,Arm CPU已經(jīng)為各種平臺上的AI加速奠定了基礎(chǔ)。
就靈活性而言,這對生態(tài)系統(tǒng)大有裨益的三個主要原因是,首先,Arm CPU可以處理廣泛的AI推理用例,其中許多用例通常用于數(shù)十億臺設(shè)備,例如當(dāng)今的智能手機、云和數(shù)據(jù)中心。不僅如此,除了推理之外,CPU還經(jīng)常用于技術(shù)棧中的數(shù)據(jù)預(yù)處理和編排等其他任務(wù)。其次,開發(fā)者能夠在更多種類的數(shù)據(jù)格式中運行更廣泛的軟件,而無需構(gòu)建多個版本的代碼。最后,CPU的靈活性使之成為加速AI工作負載的理想工具。
提供多樣性和選擇,助力行業(yè)靈活部署AI計算
除了CPU產(chǎn)品組合外,Arm計算平臺還包括GPU和NPU等AI加速器技術(shù),許多市場都在將這些技術(shù)與CPU進行集成。
在移動端領(lǐng)域,Arm終端計算子系統(tǒng)(CSS)包含Armv9.2 CPU集群,并與Arm Immortalis-G925 GPU集成,可為各種AI用例提供加速功能,包括圖像分割、對象檢測、自然語言處理和語音轉(zhuǎn)文本等用例。在物聯(lián)網(wǎng)(IoT)方面,Arm Ethos-U85 NPU可與需要加速AI性能的基于Arm Cortex-A的系統(tǒng)一起設(shè)計,例如工廠自動化等場景。
此外,除了Arm自己的加速器技術(shù)外,合作伙伴借助Arm的CPU靈活定制具有差異化的芯片解決方案。例如,NVIDIA用于AI基礎(chǔ)設(shè)施的Grace Blackwell和Grace Hopper超級芯片均采用了Arm CPU和NVIDIA的AI加速器技術(shù),從而顯著提升AI性能。
NVIDIA Grace Blackwell超級芯片將NVIDIA的Blackwell GPU架構(gòu)與基于Arm Neoverse的Grace CPU相結(jié)合。Arm獨特的產(chǎn)品組合使NVIDIA能夠進行系統(tǒng)級設(shè)計優(yōu)化,與NVIDIA H100 GPU相比,其能耗降低了25倍,單個GPU性能提高了30倍。具體來說,得益于Arm Neoverse平臺的靈活性,NVIDIA能夠?qū)崿F(xiàn)自有的高帶寬NVLink互連技術(shù),并提升CPU、GPU和內(nèi)存之間的數(shù)據(jù)帶寬和延遲。
Arm致力于通過Arm全面設(shè)計生態(tài)項目,為整個生態(tài)系統(tǒng)注入AI加速的機遇。通過該生態(tài)項目,開發(fā)者可以更快訪問Arm CSS技術(shù),賦能軟硬件技術(shù)進步,以此驅(qū)動AI和芯片創(chuàng)新,并加快開發(fā)和部署AI優(yōu)化的芯片解決方案。
Arm架構(gòu)滿足AI所需的獨特靈活性
Arm CPU設(shè)計所具有靈活性關(guān)鍵在于Arm領(lǐng)先的架構(gòu)。它提供了一個可以與AI加速器技術(shù)緊密集成的基礎(chǔ)平臺,并支持從128位到2,048位的各種向量長度,可以在許多不同的數(shù)據(jù)點上輕松執(zhí)行多個神經(jīng)網(wǎng)絡(luò)。
Arm架構(gòu)的靈活性為整個芯片生態(tài)系統(tǒng)提供了多樣化的定制機會,Arm一直致力于幫助合作伙伴更快地構(gòu)建自己的差異化芯片解決方案。這種獨特的靈活性也使Arm能夠不斷進行架構(gòu)創(chuàng)新,定期推出關(guān)鍵指令和功能來加速AI計算,進而惠及整個生態(tài)系統(tǒng),其中包括領(lǐng)先的芯片合作伙伴,以及在Arm計算平臺上構(gòu)建應(yīng)用的2,000多萬軟件開發(fā)者等。
這一切始于Armv7架構(gòu),該架構(gòu)引入了高級單指令多數(shù)據(jù)(SIMD)擴展,例如Neon技術(shù),這是Arm首次涉足機器學(xué)習(xí)(ML)工作負載。在過去幾年中,該架構(gòu)不斷增強,Armv8中增加了向量點積和矩陣乘法特性,之后在Armv9中又引入了Arm SVE2和新的Arm SME技術(shù),為廣泛的生成式AI工作負載和用例提高了計算性能并降低了功耗。
與AI加速器技術(shù)無縫集成
Arm是AI時代的計算平臺,推動了持續(xù)的架構(gòu)創(chuàng)新,以滿足速度更快、互動性更好和沉浸感更強的AI應(yīng)用的發(fā)展。Arm CPU作為靈活處理AI工作負載的異構(gòu)計算方法中的一部分,可以無縫增強和集成GPU和NPU等AI加速器技術(shù)。
Arm CPU是處理眾多AI推理工作負載的實用之選,憑借出色的靈活性,它能夠與加速器技術(shù)無縫集成,打造更強大、更高性能的AI功能,精準(zhǔn)滿足特定用例和計算需求。對于Arm的技術(shù)合作伙伴而言,出色的靈活性有助于實現(xiàn)豐富的定制選擇,使他們能夠為AI工作負載構(gòu)建完整的芯片解決方案。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )