聯(lián)想詳解AI導(dǎo)向基礎(chǔ)設(shè)施 “軟硬一體”賦能四大場景

9月25日,聯(lián)想在杭州舉辦以“全棧智能 全程陪伴”為主題的新IT思享會,集中展示了聯(lián)想基于新IT架構(gòu)的全棧智能產(chǎn)品與服務(wù),引領(lǐng)行業(yè)智能變革的強大實力。

當(dāng)前,以ChatGPT為代表的AI模型席卷全球,不僅實現(xiàn)了AI技術(shù)質(zhì)變性突破,還推動AI應(yīng)用與產(chǎn)業(yè)融合,加速AI落地千行百業(yè)。

在此背景下,聯(lián)想中國區(qū)基礎(chǔ)設(shè)施事業(yè)部架構(gòu)師耿太平在會上,重點詳細解讀了聯(lián)想AI算力戰(zhàn)略,以及具體落地實踐。他表示:“在實際業(yè)務(wù)實踐中,聯(lián)想AI導(dǎo)向的基礎(chǔ)設(shè)施聚焦大模型訓(xùn)練、訓(xùn)推一體、AI For Science和AI生成四大AI應(yīng)用場景,提供軟硬件整體方案來落地聯(lián)想AI算力戰(zhàn)略。”

(聯(lián)想中國區(qū)基礎(chǔ)設(shè)施事業(yè)部架構(gòu)師耿太平)

錨定AI算力,聚焦四大場景打造AI導(dǎo)向基礎(chǔ)設(shè)施

全球人工智能發(fā)展洶涌澎湃,算力規(guī)模不斷攀升。截止2021年,中國的算力規(guī)模達到203EFLOPS,僅次于美國位居世界第二,年增長率為53%,高于全球平均的增長率10個百分點。會上,耿太平表示,目前AI算力規(guī)模已經(jīng)超過通用算力,未來預(yù)計到2026年,僅中國的AI算力規(guī)模就會達到1271.4 EFLOPS,年復(fù)合增長率達52.3%,AI算力成為算力發(fā)展的主要方向。

面對日益增長的AI算力需求,聯(lián)想在今年8月,正式發(fā)布AI算力戰(zhàn)略,全面打造以AI為導(dǎo)向的算力基礎(chǔ)設(shè)施。耿太平介紹道,聯(lián)想AI算力戰(zhàn)略具備AI賦智和綠色賦能兩大特征。其中,AI賦智為,100%算力基礎(chǔ)設(shè)施產(chǎn)品支持AI,50% 基礎(chǔ)設(shè)施研發(fā)投入在AI領(lǐng)域,全面AI技術(shù)覆蓋全域AI應(yīng)用;綠色賦能是指,全面布局和引領(lǐng)液冷技術(shù),打造液冷集群方案燈塔,以綠色算力基礎(chǔ)設(shè)施助推智算產(chǎn)業(yè)可持續(xù)發(fā)展。

(聯(lián)想全面打造AI導(dǎo)向的基礎(chǔ)設(shè)施)

AI算力戰(zhàn)略引導(dǎo)下,耿太平分享稱,在實際的業(yè)務(wù)實踐中,聯(lián)想推出了AI算力全棧全域框架,聚焦四大應(yīng)用場景,提供軟硬件的整體方案來推動AI戰(zhàn)略不斷落地。具體來看,聯(lián)想不僅提供豐富的AI算力所需的基礎(chǔ)設(shè)施,還通過整合不同算力需求的AI軟件平臺,高效覆蓋大模型訓(xùn)練、訓(xùn)推一體、AI for Science和AI生成四大應(yīng)用場景,從而更好地賦能AI行業(yè)生態(tài)。

耿太平進一步闡述道:“AI大模型訓(xùn)練服務(wù)器和AI訓(xùn)推一體服務(wù)器+Lenovo AI Master軟件的方案,可以覆蓋大模型訓(xùn)練和訓(xùn)推一體場景的應(yīng)用;科學(xué)計算異構(gòu)服務(wù)器+LiCO軟件的組合,可以覆蓋AI for Science場景的應(yīng)用;AI生成服務(wù)器+NVIDIA OVE軟件的組合,可以覆蓋AI生成場景的應(yīng)用。”

截至目前,聯(lián)想已成為全球第三大AI基礎(chǔ)設(shè)施和服務(wù)器供應(yīng)商,全面覆蓋云端、邊緣算力場景,同時滿足AI大模型和傳統(tǒng)模型的訓(xùn)練、推理需求,并實現(xiàn)AI應(yīng)用場景的深度覆蓋,目前已實現(xiàn)智慧制造、智慧醫(yī)療、地質(zhì)勘探等領(lǐng)域的應(yīng)用。

澎湃算力,構(gòu)筑堅實AI基礎(chǔ)設(shè)施底座

AI通用大模型以燎原之勢席卷全球,帶動算力需求和參數(shù)量呈指數(shù)級增長,構(gòu)建滿足其發(fā)展的AI算力最為緊迫。

第一大場景是AI大模型訓(xùn)練。會上,耿太平分析稱,Open AI最新GPT-4模型算力需求是GPT-3的59倍,模型參數(shù)量是GPT-3的10倍以上。為滿足大規(guī)模數(shù)據(jù)訓(xùn)練需求,AI算力基礎(chǔ)設(shè)施需具備縱向高性能擴展和橫向靈活擴展能力。聯(lián)想在今年8月推出的聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器很好的滿足了這一需求,具有澎湃性能巨幅提升、靈活架構(gòu)按需配比和擴展不同算力等特點。

(聯(lián)想問天 WA7780 G3 AI大模型訓(xùn)練服務(wù)器)

性能方面,該服務(wù)器可提供32PFLOPS的AI算力,支持高達400Gb/s的高性能網(wǎng)絡(luò),擁有高達640GB的HBM3高速顯存。由于搭載的H800GPU相較上一代的GPU AI性能有高達3.44倍的提升,同時升級了第4代Tensor Core和 Transformer的引擎,使得大模型AI訓(xùn)練提升9倍,大模型AI推理性能提升30倍。靈活架構(gòu)方面,該服務(wù)器通過采用了GPU Direct Storage (GDS) 技術(shù),讓GPU與NVMe直接進行數(shù)據(jù)的通訊,同時實現(xiàn)GPU與NVMe 靈活配比(1:1或2:1),大幅提高程序載入數(shù)據(jù)的速度,提升大模型訓(xùn)練的性能。

第二大場景是訓(xùn)推一體場景。為應(yīng)對大模型推理和傳統(tǒng)訓(xùn)練以及云游戲、模擬仿真等多元算力需求,聯(lián)想問天WA5480 G3 AI 訓(xùn)推一體服務(wù)器可支持業(yè)界主流的PCle規(guī)格的AI加速卡,可以按照場景要求模塊化配置GPU算力。該服務(wù)器還支持豐富生態(tài),通過對系統(tǒng)拓撲和結(jié)構(gòu)的兼容性設(shè)計以及軟件的調(diào)優(yōu),可支持Intel、寒武紀(jì)、摩爾等多元AI芯片。此外,該服務(wù)器安全可靠,通過N+N冗余的電源設(shè)計和動態(tài)的軟件監(jiān)控,可確保無間斷運行和穩(wěn)定的性能。

可以看出,聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器和WA5480 G3 AI 訓(xùn)推一體服務(wù)器專為AI大模型而生,滿足AI大模型所需的數(shù)據(jù)訓(xùn)練和推理需求。耿太平還表示,兩款服務(wù)器在保證高性能的同時實現(xiàn)了低功耗運行。其中,聯(lián)想問天WA7780 G3 AI大模型訓(xùn)練服務(wù)器通過創(chuàng)新三層獨立風(fēng)道設(shè)計,根據(jù)不同的部件,散熱特征進行優(yōu)化,可以節(jié)省散熱功耗1000瓦。

綠色算力,加速AI技術(shù)高效利用

除了AI大模型蓬勃發(fā)展, AI技術(shù)與產(chǎn)業(yè)融合帶動AI應(yīng)用不斷落地掀起產(chǎn)業(yè)智能化變革。聯(lián)想不僅聚焦通用人工智能領(lǐng)域,還看重AI與產(chǎn)業(yè)深度融合,致力于為行業(yè)智能化變革打造算力“新基建”。

第三大場景是AI for Science,科學(xué)計算和AI在加速融合。一方面AI算法科學(xué)應(yīng)用實現(xiàn)了創(chuàng)新發(fā)展。如在氣象領(lǐng)域,F(xiàn)orecastNet模型可將氣象預(yù)測的速度提升4.5萬倍。在生命科學(xué)領(lǐng)域,Alpha Fold2可以幫助科學(xué)家精準(zhǔn)預(yù)測蛋白質(zhì)的結(jié)構(gòu)。另一方面,針對計算密集型應(yīng)用,原來在CPU上的科學(xué)算法在不斷向異構(gòu)計算進行遷移,如材料科學(xué)領(lǐng)域的VASP和冷凍電鏡RELION,因此當(dāng)前科學(xué)計算算力基礎(chǔ)設(shè)施既需要滿足傳統(tǒng)的科學(xué)計算,又需要兼顧日益增長的AI需求。

基于此,聯(lián)想推出了科學(xué)異構(gòu)計算服務(wù)器——聯(lián)想Think System SD650-I V3。這款服務(wù)器可實現(xiàn)異構(gòu)多元,CPU和GPU的比例是1:2,可以進行最佳的異構(gòu)計算。此外,GPU的雙精度算力單節(jié)點額可達到210TFLOPS,GPU之間可通過XeLink進行高速互聯(lián)。該服務(wù)器還具有極致高密和綠色節(jié)能的特點:42U整機柜可以支持多達144顆GPU,提供7.5PFLOPS的雙精度算力; PUE小于1.1, 全水冷設(shè)計,零噪音,可支持余熱回收。

(聯(lián)想Think System SD650-I V3)

最后一個是AI生成場景,即 AI生成技術(shù)與各行各業(yè)深度結(jié)合,在未來數(shù)字工廠、數(shù)字孿生地球、火勢蔓延模擬、5G信號模擬等虛擬應(yīng)用場景加速落地,不斷刷新AI創(chuàng)新行業(yè)的想象力。而這些應(yīng)用背后都需要強大的AI算力支持,逼真且低延遲的渲染能力、整合離散的設(shè)計工具和協(xié)同多人在線實時工作能力等。

聯(lián)想在這些領(lǐng)域進行了領(lǐng)先布局,推出了AI生成OVX基礎(chǔ)設(shè)施方案。該方案包含高速全閃存儲(DSS-G)用于存放海量的數(shù)據(jù)、國內(nèi)首款OVX3.0認證的AI生成服務(wù)器,OVX SR675 V3,搭載英偉達 Omniverse Enterprise軟件一起來提供AI+渲染能力,同時可實現(xiàn)多種軟件工具和多人多地的在線實時協(xié)作,還包含高速的交換機,為縱向和橫向的擴展部署提供便利。

(聯(lián)想AI生成OVX基礎(chǔ)設(shè)施方案)

耿太平表示,在AI浪潮下,AI正加速與產(chǎn)業(yè)融合推動智能生產(chǎn)力重塑產(chǎn)業(yè)。聯(lián)想將以AI賦智、綠色賦能全面打造AI導(dǎo)向算力基礎(chǔ)設(shè)施建設(shè),為助力AI賦能行業(yè)提供源源不斷的發(fā)展動能。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )