全棧才是未來,“攢機(jī)型”人工智能計(jì)算中心還能走多遠(yuǎn)?

隨著人工智能逐漸成為推動(dòng)社會(huì)經(jīng)濟(jì)發(fā)展的新引擎,各行各業(yè)都隨之步入產(chǎn)業(yè)智能升級(jí)的隊(duì)列。在越來越旺盛的算力需求下,我國(guó)的人工智能計(jì)算中心正呈現(xiàn)全面開花、多點(diǎn)落地的態(tài)勢(shì)。然而,與其他領(lǐng)域的發(fā)展初期類似,伴隨人工智能中心的建設(shè)熱潮,相關(guān)的爭(zhēng)議及討論也越來越多:有認(rèn)為人工智能計(jì)算中心建起來不一定能用上的,有認(rèn)為人工智能計(jì)算中心建設(shè)需要根據(jù)算力定價(jià)格的,還有認(rèn)為越多臺(tái)AI服務(wù)器就代表人工智能計(jì)算中心能力更強(qiáng)的等等。

不被雜音誤導(dǎo)則需回歸本源,人工智能計(jì)算中心是以基于AI芯片構(gòu)建的AI計(jì)算機(jī)集群為基礎(chǔ),涵蓋了包括基建設(shè)施、硬件設(shè)備和軟件應(yīng)用在內(nèi)的完整系統(tǒng)。而系統(tǒng)的構(gòu)成,硬件部分往往最先被考量,那么我們先從AI訓(xùn)練芯片說起。

硬件基礎(chǔ)設(shè)施:重點(diǎn)關(guān)注訓(xùn)練芯片

AI芯片對(duì)于人工智能有多重要?一言以蔽之,各行業(yè)、各企業(yè)數(shù)字化轉(zhuǎn)型需要構(gòu)建匹配自身的AI模型,而高質(zhì)量AI模型則需要通過訓(xùn)練持續(xù)迭代優(yōu)化而來。這就要求提供算力的當(dāng)?shù)?a href="http://picoinsstore.com/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD_1.html" target="_blank" class="keylink">人工智能計(jì)算中心具備高性能的AI芯片,以此確保充沛、穩(wěn)定的算力供應(yīng)。

具體到AI芯片,又分訓(xùn)練芯片和推理芯片,其中訓(xùn)練芯片是基礎(chǔ)中的基礎(chǔ),因?yàn)锳I首先要解決認(rèn)知訓(xùn)練的問題,然后才是推理,這就要求訓(xùn)練芯片必須具備浮點(diǎn)運(yùn)算能力,因?yàn)樵趶?fù)雜模型的訓(xùn)練過程中,需對(duì)上千億個(gè)浮點(diǎn)參數(shù)進(jìn)行微調(diào)數(shù)十萬步,需要精細(xì)的浮點(diǎn)表達(dá)能力。相比之下,無浮點(diǎn)運(yùn)算能力的芯片如用于訓(xùn)練將增加約40%的額外操作,以及至少4倍的內(nèi)存讀寫次數(shù)。

軟件基礎(chǔ)設(shè)施:框架自主可控和AI使能更關(guān)鍵

框架是所有算法模型的開發(fā)基礎(chǔ),90%的AI應(yīng)用開發(fā)都是基于AI框架,其重要性毋庸置疑?,F(xiàn)階段很多廠商采用的都是國(guó)外的AI開源框架,實(shí)際上相當(dāng)于將中國(guó)人工智能發(fā)展的可控性交到了他國(guó)手中。未來國(guó)與國(guó)之間的科技競(jìng)爭(zhēng)將愈演愈烈,一旦出現(xiàn)問題,我國(guó)想要重新實(shí)現(xiàn)安全、自主、可控的技術(shù)布局,勢(shì)必要從底層將一切推倒重建,可能造成大量的人力、物力和財(cái)力損失。

與其亡羊補(bǔ)牢,不如防患于未然。讓人工智能計(jì)算中心在建設(shè)之初就實(shí)現(xiàn)國(guó)產(chǎn)化,擁有自主可控的AI框架,目前已成為業(yè)內(nèi)的基本共識(shí)。據(jù)悉,目前大多數(shù)人工智能計(jì)算中心都使用了國(guó)產(chǎn)自研的全場(chǎng)景AI計(jì)算框架MindSpore,該框架原生支持大模型訓(xùn)練,并支持端、邊、云全場(chǎng)景協(xié)同,具備安全可信、高效執(zhí)行、一次開發(fā)多次部署的能力。

框架之外, AI使能平臺(tái)也需要關(guān)注。以武漢人工智能計(jì)算中心采用的ModelArts為例,該平臺(tái)是全功能AI平臺(tái),功能豐富,具備多租戶、細(xì)粒度資源管理的能力,包含一體化的集成開發(fā)環(huán)境,支持大規(guī)模訓(xùn)練數(shù)據(jù)管理、大模型的大規(guī)模分布式訓(xùn)練,并集成了自主可控的AI計(jì)算框架及第三方框架。在云管平臺(tái)方面,安全、易用是關(guān)鍵考量:可提供公有云技術(shù)滿足公共服務(wù)平臺(tái)技術(shù)要求,支持多租戶管理與資源隔離;源自云的服務(wù)能力,統(tǒng)一運(yùn)維,統(tǒng)一計(jì)量。

輔助運(yùn)營(yíng): “建起來”更要“用的好”

人工智能計(jì)算中心想要穩(wěn)定運(yùn)行,建設(shè)和使用之間就不能出現(xiàn)斷層。當(dāng)下的人工智能計(jì)算中心通常由地方政府牽頭,技術(shù)支持廠商參與建設(shè)。但有些廠商只管建,卻不管養(yǎng),或者提供不了全面的輔助運(yùn)營(yíng)。

輔助運(yùn)營(yíng)是發(fā)展人工智能產(chǎn)業(yè)的保障,這一點(diǎn)是業(yè)內(nèi)專家和項(xiàng)目實(shí)踐的共識(shí)。例如武漢、西安、深圳等地的人工智能計(jì)算中心在建成之后,技術(shù)支持廠商設(shè)立生態(tài)創(chuàng)新中心,組建輔助運(yùn)營(yíng)團(tuán)隊(duì),以“扶上馬、送一程”的方式輔助運(yùn)營(yíng)公司開展計(jì)算中心算力運(yùn)營(yíng)和生態(tài)運(yùn)營(yíng),向當(dāng)?shù)仄髽I(yè)提供產(chǎn)品、客戶、渠道等支持服務(wù),并給當(dāng)?shù)仄髽I(yè)提供科研創(chuàng)新、人才培養(yǎng)、應(yīng)用孵化、產(chǎn)業(yè)發(fā)展等服務(wù)。這一做法確保了人工智能計(jì)算中心建起來之后,既可以高效發(fā)揮算力價(jià)值,也可以確保AI產(chǎn)業(yè)生態(tài)建設(shè)。

除了軟硬件,全棧一體化還涵蓋基建設(shè)施,同樣以武漢、西安人工智能計(jì)算中心為例,技術(shù)支持廠商采用預(yù)制模塊化方式建設(shè),不到半年即完成了建設(shè)交付,其建設(shè)周期是傳統(tǒng)樓宇方式機(jī)房建設(shè)的一半,效率對(duì)比高下立現(xiàn)。

當(dāng)下,國(guó)內(nèi)人工智能計(jì)算中心的規(guī)劃與建設(shè)如火如荼,隨著武漢、西安、深圳等地人工智能計(jì)算中心正式投入運(yùn)營(yíng)后對(duì)當(dāng)?shù)厝斯ぶ悄墚a(chǎn)業(yè)的口碑反饋,全棧一體化的優(yōu)勢(shì)將更加凸顯。相信在可以預(yù)見的將來,選擇全棧解決方案的人工智能計(jì)算中心會(huì)越來越多,為我國(guó)數(shù)字經(jīng)濟(jì)的快速發(fā)展提供更多動(dòng)力。


(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2021-09-24
全棧才是未來,“攢機(jī)型”人工智能計(jì)算中心還能走多遠(yuǎn)?
隨著人工智能逐漸成為推動(dòng)社會(huì)經(jīng)濟(jì)發(fā)展的新引擎,各行各業(yè)都隨之步入產(chǎn)業(yè)智能升級(jí)的隊(duì)列。在越來越旺盛的算力需求下,我國(guó)的人工智能計(jì)算中心正呈現(xiàn)全面開花、多點(diǎn)落地的態(tài)勢(shì)。然而,與其他領(lǐng)域的發(fā)展初期類似,伴隨人工智能中心的建設(shè)熱潮,相關(guān)的爭(zhēng)議及討論也越來越多:有認(rèn)為人工...

長(zhǎng)按掃碼 閱讀全文