“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0

12月2日,在加拿大舉行的第32屆NIPS神經(jīng)信息處理系統(tǒng)大會上,百度正式發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0。該平臺專為AI深度學(xué)習(xí)場景優(yōu)化設(shè)計,每秒完成2000萬億次深度神經(jīng)網(wǎng)絡(luò)計算,極大的加快了AI深度學(xué)習(xí)模型的訓(xùn)練速度。

NIPS作為機器學(xué)習(xí)和神經(jīng)計算領(lǐng)域的頂級會議,吸引了機器學(xué)習(xí)、人工智能、統(tǒng)計等領(lǐng)域的眾多國際專家參與。近年來,在計算機視覺、語音識別、自然語言處理等領(lǐng)域也出現(xiàn)了大量的創(chuàng)新應(yīng)用,NIPS在AI深度學(xué)習(xí)領(lǐng)域的學(xué)術(shù)影響力變得舉足輕重。



“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0


算法、數(shù)據(jù)和計算是推動AI深度學(xué)習(xí)技術(shù)快速發(fā)展的三大要素。為支持更強的泛化能力,更高的預(yù)測精度,算法模型日趨復(fù)雜,越來越多的數(shù)據(jù)需要被及時標(biāo)注和處理,計算性能成為關(guān)鍵。百度X-MAN超級AI計算平臺提供極致的計算性能,支持超大復(fù)雜算法模型,能夠快速及時處理海量數(shù)據(jù)。自2016年誕生以來,百度X-MAN超級AI計算平臺歷經(jīng)3代發(fā)展,3次架構(gòu)升級,創(chuàng)造6項業(yè)界第一,同時期關(guān)鍵技術(shù)&性能保持領(lǐng)先,引領(lǐng)行業(yè)發(fā)展趨勢。目前,X-MAN系列產(chǎn)品已在百度大規(guī)模應(yīng)用,正在助力百度AI戰(zhàn)略快速落地。


“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0


X-MAN解決的3大關(guān)鍵技術(shù)挑戰(zhàn)

為提供更強的計算性能和最佳的計算效率,X-MAN在系統(tǒng)設(shè)計中面臨了三大關(guān)鍵技術(shù)的挑戰(zhàn):如何有效提升單機計算性能、如何實現(xiàn)多機加速的高可擴展性以及如何均衡CPU與AI加速芯片的配比關(guān)系,以避免系統(tǒng)瓶頸。

在有限的單機空間內(nèi),集成更多數(shù)量、性能更強、互聯(lián)帶寬更高的AI加速卡,是提升單機計算性能的直接手段,但帶來了高速互聯(lián)、結(jié)構(gòu)、散熱、供電等硬件技術(shù)難題;單機訓(xùn)練方式難以滿足超大規(guī)模數(shù)據(jù)集和復(fù)雜的模型場景下的計算力需求,大規(guī)模分布式訓(xùn)練成為必然,解決多機加速的可擴展性就成了關(guān)鍵技術(shù)難題;深度學(xué)習(xí)模型的負(fù)載差異較大,CPU密集型,計算密集型,通信密集型,存在著多種需求場景,為了避免系統(tǒng)性能瓶頸、充分發(fā)揮計算效率,如何快速靈活的調(diào)整CPU和AI計算芯片的配比并支持獨立迭代升級成了關(guān)鍵的技術(shù)難題。

X-MAN的3次架構(gòu)升級和9大技術(shù)特征

自2016年首次發(fā)布以來,X-MAN的三代產(chǎn)品各自都有著鮮明的設(shè)計理念:超高的計算密度、高效散熱、兼容多元化AI加速芯片。X-MAN通過3次架構(gòu)升級,有效攻克了3大技術(shù)挑戰(zhàn)。

X-MAN1.0發(fā)布于2016年Q2,單機可以支持16個AI加速卡,最高擴展到64,實現(xiàn)了超高的計算密度。X-MAN1.0具備4大技術(shù)特征:硬件解耦、資源池化、PCIe Fabric技術(shù)、100G RDMA高速互聯(lián)。

X-MAN2.0發(fā)布于2017年Q3,通過冷板式液冷散熱技術(shù)實現(xiàn)了超高的散熱效率。和業(yè)界主流方案一樣,X-MAN2.0可以支持8卡NVLink高速互聯(lián),差異化方面,X-MAN2.0具備2大技術(shù)特征:液冷散熱和靈活的IO支持。

隨著AI人工智能技術(shù)的快速發(fā)展,眾多AI芯片公司應(yīng)運而生,AI芯片格局正呈現(xiàn)多元化發(fā)展趨勢。此次NIPS大會上發(fā)布的X-MAN3.0,采用了硬件系統(tǒng)模塊化、互聯(lián)接口標(biāo)準(zhǔn)化、互聯(lián)拓?fù)涓哽`活性的設(shè)計思路,既提升了多元化AI加速芯片的兼容性,也促進了AI加速芯片生態(tài)健康、快速、可持續(xù)的發(fā)展。X-MAN3.0具備3大關(guān)鍵技術(shù)特征,包括48V供電技術(shù)、標(biāo)準(zhǔn)化的AI加速卡接口定義和靈活的互聯(lián)拓?fù)洹?/p>

此次百度快速研發(fā)落地X-MAN3.0,得到了浪潮、英業(yè)達(dá)等服務(wù)器系統(tǒng)廠商的積極參與支持; 我們期待有更多的服務(wù)器系統(tǒng)合作伙伴、AI加速芯片廠商和同行加入共建開放的生態(tài),促進整個生態(tài)圈的良性發(fā)展。


“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0


X-MAN1.0

“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0


X-MAN2.0

“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0


X-MAN3.0

X-MAN創(chuàng)造了6項業(yè)界第一,引領(lǐng)行業(yè)技術(shù)發(fā)展趨勢

憑借著對AI業(yè)務(wù)模型的深刻理解、扎實的硬件基礎(chǔ)架構(gòu)技術(shù)和對行業(yè)趨勢的準(zhǔn)確預(yù)判,百度設(shè)計了X-MAN AI計算平臺系列產(chǎn)品,創(chuàng)造了6項業(yè)界第一。其中, 2016年Q2發(fā)布的X-MAN1.0創(chuàng)造了5個業(yè)界第一:首次實現(xiàn)單機擴展16片AI加速卡;首次實現(xiàn)4/8/16/32/64卡系統(tǒng)級彈性擴展;首次實現(xiàn)AI計算硬件解耦架構(gòu)(注:Facebook 2017年Q1發(fā)布的Big Basin、微軟2017年Q1發(fā)布的HGX-1等都采用了相似設(shè)計理念);首次實現(xiàn)PCIe Fabric技術(shù)架構(gòu),支持按需求業(yè)務(wù)動態(tài)分配AI計算資源;首次實現(xiàn)虛擬機多卡高速無損通信技術(shù)(native performance)。2017年Q3發(fā)布的X-MAN2.0業(yè)界首創(chuàng)將冷板式液冷散熱技術(shù)應(yīng)用到AI計算產(chǎn)品里,有效解決了高性能AI加速卡的散熱挑戰(zhàn)(注:Google 2018年Q2發(fā)布的TPU3.0也采用了相似技術(shù))。

X-MAN大規(guī)模部署,助力百度AI戰(zhàn)略快速落地

憑借著強大的單機計算性能、業(yè)界領(lǐng)先的多機擴展性、靈活的AI計算資源動態(tài)分配調(diào)整能力,X-MAN系列產(chǎn)品已在百度實現(xiàn)規(guī)?;渴穑瑥V泛應(yīng)用于語音識別、計算機視覺、自然語音處理、無人車等基礎(chǔ)AI技術(shù)的深度學(xué)習(xí)模型訓(xùn)練,將訓(xùn)練時間從周級別縮短到天級別;服務(wù)于百度DuerOS、Apollo、ABC Cloud等核心業(yè)務(wù),助力百度AI戰(zhàn)略的快速落地。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-12-03
“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0
該平臺專為AI深度學(xué)習(xí)場景優(yōu)化設(shè)計,每秒完成2000萬億次深度神經(jīng)網(wǎng)絡(luò)計算,極大的加快了AI深度學(xué)習(xí)模型的訓(xùn)練速度。

長按掃碼 閱讀全文