大緩存更強(qiáng)勁,搭載 AMD Milan-X 的浪潮 GPU 服務(wù)器 NF5468A5 深度評(píng)測(cè)

據(jù)近日業(yè)界發(fā)布的評(píng)測(cè)報(bào)告顯示,以浪潮 GPU 服務(wù)器 NF5468A5 為平臺(tái),搭載 2 顆 AMD Milan-X 7773X 運(yùn)行常見(jiàn)的氣象應(yīng)用 WRF 和計(jì)算流體力學(xué)應(yīng)用 OpenFOAM 作為性能基準(zhǔn)測(cè)試,其性能相比搭載兩顆 Rome 7742 時(shí)的計(jì)算性能提升可高達(dá) 80%。

NF5468A5 是一款 4U 支持 2 顆 AMD EPYC 處理器和 8 顆雙寬 GPU 卡,面向 AI 訓(xùn)練、推理、視頻編解碼等多種應(yīng)用場(chǎng)景的 GPU 服務(wù)器。此次測(cè)試采用分別搭載 2 顆 AMD Milan-X 7773X、Milan 7543 和 Rome 7742 的配置組合。

AMD Milan-X 處理器最大的亮點(diǎn),就是采用 3D 堆疊技術(shù)(3D V-Cache),在不改變處理器面積的前提下,可用 L3 緩存(SRAM)總數(shù)增加三倍。做個(gè)形象的比喻,這種 3D 堆疊技術(shù)就像將把相同面積的平房升級(jí)成三層小樓,通過(guò)縱向空間成倍擴(kuò)展緩存數(shù)量。評(píng)測(cè)采用的 NF5468A5 平臺(tái)是浪潮信息暢銷海內(nèi)外的彈性云 AI 服務(wù)器 NF5468 系列的全新產(chǎn)品,率先支持 PCIe 4.0 技術(shù),4U 空間內(nèi)可裝載 2 顆采用 7nm 先進(jìn)制程工藝的 AMD EPYC 處理器和 8 塊 PCIe Gen4 接口的 AI 加速卡,能夠最大限度的發(fā)揮 Milan-X 處理器的極致性能。

WRF(The Weather Research and Forecasting Model),即天氣預(yù)報(bào)模式,被譽(yù)為是次世代的中尺度天氣預(yù)報(bào)模式,往往用于大范圍高分辨的氣候模擬,對(duì)系統(tǒng)的運(yùn)算性能、內(nèi)存的要求非常高;OpenFOAM(Open Source Field Operation and Manipulation)是對(duì)連續(xù)介質(zhì)力學(xué)問(wèn)題進(jìn)行數(shù)值計(jì)算的軟件,經(jīng)常應(yīng)用于汽車仿真等行業(yè),進(jìn)行仿真計(jì)算需要處理大量的實(shí)時(shí)數(shù)據(jù),所以對(duì)系統(tǒng)的計(jì)算能力、數(shù)據(jù)吞吐能力都有很高的要求。

基于浪潮 NF5468A5 評(píng)測(cè)報(bào)告顯示,Milan-X 處理器通過(guò)搭載 3D 堆疊技術(shù)獲得更高的 L3 緩存,確實(shí)對(duì)計(jì)算性能有較大提升,而性能改進(jìn)意味著企業(yè)可以在更少的服務(wù)器上運(yùn)行相同的作業(yè),消耗的功率也能有明顯降低。如下是評(píng)測(cè)報(bào)告中的性能測(cè)試數(shù)據(jù):

在 WRF 測(cè)試中,使用單節(jié)點(diǎn)相同核心數(shù),以 Rome 7742 處理器運(yùn)行時(shí)間為基準(zhǔn),在 Milan 7543 上的計(jì)算性能提升 14%~27%,而在 Milan-X 7773X 處理器上性能提升 23%~34%。

在 OpenFOAM 基準(zhǔn)算例 motorBike 測(cè)試中,使用不可壓穩(wěn)態(tài)求解器 simpleFoam 計(jì)算模擬摩托車和騎手周圍空氣的運(yùn)動(dòng)情況。同樣以 Rome 7742 處理器為基準(zhǔn),OpenFOAM 在 Milan 7543 處理器使用單節(jié)點(diǎn)相同核心測(cè)試性能提升 23%~28%,在 Milan-X 7773X 處理器上性能提升 34%~80%。

在本次評(píng)測(cè)中也對(duì) NF5468A5 有比較細(xì)致的介紹,據(jù)浪潮官網(wǎng)顯示 NF5468A5 正在推出“超值機(jī)型限免試用”,對(duì)該 GPU 服務(wù)器感興趣的不妨一試。如下是評(píng)測(cè)中對(duì)于浪潮 NF5468A5 的介紹:

NF5468A5 采用分區(qū)散熱設(shè)計(jì),內(nèi)置獨(dú)立的 CPU 和 GPU 主板,且分別安裝在不同的平面。從機(jī)箱內(nèi)部結(jié)構(gòu)來(lái)看,設(shè)計(jì)者將發(fā)熱量高的的 GPU 放在了機(jī)箱上 3U 空間,CPU 板處于機(jī)箱下 1U,內(nèi)置 6 對(duì) 12 個(gè) 6056 風(fēng)扇模組配合導(dǎo)風(fēng)罩,實(shí)現(xiàn)機(jī)箱內(nèi)風(fēng)道分流,正是基于這種獨(dú)特分層散熱設(shè)計(jì),使得送測(cè)的 NF5468A5 服務(wù)器可以支持 280W 最高功耗的 Milan-X 7773X。系統(tǒng)設(shè)計(jì)支持 32 條 DDR4 ECC 內(nèi)存,支持 LRDIMM / RDIMM,提供高達(dá) 8T 的本地內(nèi)存, 實(shí)現(xiàn)與 1536 MB 超大 L3 cache 間的高速數(shù)據(jù)交互。

NF5468A5 采用了 CPU 直連 GPU 架構(gòu)設(shè)計(jì),率先支持 PCI-E 4.0 技術(shù),最大限度提升 CPU 與 GPU 間的帶寬,降低通信延遲,達(dá)到最佳效能,為客戶提供極致優(yōu)化的算力。系統(tǒng)提供豐富的 IO 擴(kuò)展能力,提供 10 個(gè) PCIe 4.0 X16 擴(kuò)展槽位,支持 8 個(gè)全高全長(zhǎng)的 GPU 加速卡。提供靈活存儲(chǔ)方案,可選前置 12×3.5 英寸硬盤或 24×2.5 英寸硬盤,提供超大的本地存儲(chǔ)能力,同時(shí)最大可支持 8 個(gè)熱插拔 NVMe SSD 全閃配置,提供存儲(chǔ)到內(nèi)存到 L3 cache 的高速訪存,可實(shí)現(xiàn)十倍于高端企業(yè)級(jí) SATA SSD 的 IOPS 性能,帶來(lái)極致 IO 存儲(chǔ)性能飛躍。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )