浪潮 AI 服務器創(chuàng)全球權威 MLPerf 基準測試 18 項 AI 性能紀錄

美國東部時間10月21日,全球備受矚目的權威AI基準測試MLPerf公布今年的推理測試榜單,浪潮AI服務器NF5488A5一舉創(chuàng)造18項性能紀錄,在數據中心AI推理性能上遙遙領先其他廠商產品。

MLPerf是當前全球最具影響力的AI計算基準評測組織,由圖靈獎得主大衛(wèi)·帕特森(David?Patterson)聯合谷歌、斯坦福、哈佛大學等單位共同成立,每年組織全球AI訓練和AI推理性能測試并發(fā)榜。此次MLPerf的AI推理基準測試有全球23家公司和單位參與,在數據中心及邊緣等場景進行AI計算產品的性能比試。今年MLPerf訓練榜單已于7月公布。

浪潮NF5488A5獲數據中心AI性能絕對優(yōu)勢

此次浪潮NF5488A5一舉創(chuàng)造18項MLPerf推理性能紀錄,成為創(chuàng)紀錄最多的AI服務器。今年的測試中,數據中心AI性能最受關注,全部參與機構提交了507項性能測試數據。浪潮NF5488A5創(chuàng)下了數據中心22個賽項中的13項性能紀錄以絕對優(yōu)勢領先,NVIDIA DGX取得了5項數據中心性能紀錄。而在此前的MLPerf訓練榜單中,NF5488A5在最核心的Resnet50訓練任務中也創(chuàng)下了性能紀錄,單機性能高居榜首。

浪潮NF5488A5創(chuàng)造18項MLPerf推理性能紀錄

性能大幅提升3倍,全棧AI能力優(yōu)勢凸顯

在此次基準測試中,浪潮AI服務器NF5488A5在開放優(yōu)化(Open)和固定任務(Closed)的ResNet50基準性能測試中,均表現優(yōu)異,相比2019年MLPerf推理榜單的服務器最好性能提升高達3倍。

MLPerf ResNet50推理性能2019 VS 2020對比

NF5488A5是浪潮自研的新一代AI服務器,是此次MLPerf全球競賽中唯一可以在4U空間內支持8塊安培架構A100芯片實現NVLink高速互聯的AI服務器。浪潮NF5488A5在系統(tǒng)拓撲上采用了超低延遲設計,支持PCIe 4.0全鏈路極致優(yōu)化,高頻通信單元采用一級拓撲最近連接,最大限度提升處理器到AI芯片間的通信性能。同時,通過配置NUMA節(jié)點,確保每顆處理器與其直連的GPU之間通信性能最優(yōu),最大限度降低通信延遲。此外,NF5488A5通過深度優(yōu)化系統(tǒng)結構設計,確保設備可在高溫環(huán)境下穩(wěn)定運行。

本次基準測試中,浪潮展示出了卓越的AI計算軟硬件協同優(yōu)化能力。在硬件層面,通過對CPU、GPU硬件性能的精細校準和全面優(yōu)化,使CPU性能、GPU性能、CPU與GPU之間的數據通路均處于對AI推理最優(yōu)狀態(tài);在軟件層面,結合GPU硬件拓撲對多GPU的輪詢調度優(yōu)化使單卡至多卡性能達到了近似線性擴展;在深度學習算法層面,結合GPU Tensor Core 單元的計算特征,通過自研通道壓縮算法成功實現了模型的極致性能優(yōu)化,在精度無損的情況下性能提升近2倍。

各服務器MLPerf AI推理性能對比(以浪潮NF5488A5為基準,越高越好)

浪潮是全球領先的AI計算領導廠商,其AI服務器在中國的市場份額已連續(xù)三年保持在50%以上。浪潮致力于AI計算平臺、資源平臺和算法平臺的研發(fā)創(chuàng)新,并通過元腦生態(tài)與AI領先企業(yè)共同推進AI產業(yè)化和產業(yè)AI化進程。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )