極客網(wǎng)·極客觀察(朱飛)10月9日 ChatGPT爆火激發(fā)生成式AI熱潮,掀起 AI 大模型領域的“千模大戰(zhàn)”。隨著大模型訓練愈發(fā)深入,所涉及的參數(shù)規(guī)模愈發(fā)龐大,業(yè)界發(fā)現(xiàn)在提升數(shù)據(jù)中心算力的同時,強化數(shù)據(jù)中心運力也至關重要——高運力甚至已成為釋放大算力的關鍵因素!
這不難理解,因為對于單卡GPU等AI計算設備來說,網(wǎng)絡I/O能力已經(jīng)是制約算力充分發(fā)揮的短板;當大模型進入千卡萬卡集群時代后,大規(guī)模系統(tǒng)的算力性能和穩(wěn)定性自然更加受到網(wǎng)絡能力的制約。也就是說,網(wǎng)絡吞吐率往往決定AI的算力性能,網(wǎng)絡可靠性則決定AI訓練的穩(wěn)定性。
如何破局?在9月20日開幕的華為全聯(lián)接大會2023期間,科大訊飛攜手華為數(shù)據(jù)中心網(wǎng)絡宣布啟動AI運力底座聯(lián)合創(chuàng)新項目,同時分享了雙方在數(shù)據(jù)中心網(wǎng)絡領域的合作成果,為業(yè)界呈現(xiàn)了一個面向AI大模型場景的高運力底座解決方案及應用實踐。
訊飛識別大模型訓練三大網(wǎng)絡挑戰(zhàn):大規(guī)模,高吞吐,高可靠
在千帆競技的大模型賽道,作為AI龍頭企業(yè)科大訊飛推出的新一代認知智能大模型,訊飛星火認知大模型已經(jīng)名聲在外。在近期新華社研究院中國企業(yè)發(fā)展研究中心發(fā)布的《人工智能大模型體驗報告2.0》,訊飛星火位列國產(chǎn)主流大模型測評榜首位。而在《麻省理工科技評論》中國發(fā)布的大模型評測報告中,訊飛星火更是被評為“最聰明”的國產(chǎn)大模型。
據(jù)科大訊飛基礎設施總監(jiān)張驍介紹,在訊飛星火認知大模型的訓練過程中,團隊識別到AI訓練對于網(wǎng)絡的訴求可以歸納為三個詞:大規(guī)模,高吞吐,高可靠。
首先是大規(guī)模。AI大模型訓練涉及的參數(shù)規(guī)模動則百億千億甚至萬億,這需要AI集群調(diào)動各計算節(jié)點資源,通過高速網(wǎng)絡實現(xiàn)互聯(lián)互通、相互協(xié)作才能完成訓練任務。這意味著,無論是節(jié)點內(nèi)部還是節(jié)點之間,都需要強大的網(wǎng)絡去實現(xiàn)規(guī)模組網(wǎng)及高效部署。
其次高吞吐。集群架構下的AI大模型訓練場景中會存在負載不均衡的情況,且設備網(wǎng)絡規(guī)模越大,傳統(tǒng)負載方式?jīng)_突會越嚴重。要想充分發(fā)揮各節(jié)點的強大算力提升AI訓練效率,就必須確保網(wǎng)絡的高吞吐率。這類似于,要想提高車輛的運行速度,在拓寬道路的基礎上,還需要解決堵車的難題。
再次是高可靠。大模型訓練是一個復雜的系統(tǒng)工程,從數(shù)據(jù)準備、模型預訓練到模型訓練,系統(tǒng)穩(wěn)定運行十分重要,一旦出現(xiàn)網(wǎng)絡故障導致訓練中斷將代價不菲,因而高可靠的網(wǎng)絡基礎設施是長穩(wěn)訓練的關鍵。
“星河”聯(lián)“星火”,華為星河AI網(wǎng)絡加速訊飛星火大模型訓練
為了提升AI大模型的組網(wǎng)規(guī)模及其部署效率、AI訓練效率、AI訓練網(wǎng)絡可靠性,科大訊飛與華為數(shù)據(jù)中心網(wǎng)絡聯(lián)合創(chuàng)新,利用后者創(chuàng)新的星河AI網(wǎng)絡解決方案構筑一個大規(guī)模、高吞吐、高可靠的AI高性能數(shù)據(jù)中心網(wǎng)絡,保障了AI大模型高效、穩(wěn)定、可靠的訓練。
首先,訊飛星火認知大模型采用華為數(shù)據(jù)中心交換機構建超大規(guī)模組網(wǎng),支持了萬億參數(shù)的大規(guī)模訓練。星河AI網(wǎng)絡解決方案采用業(yè)界最高密的400GE和800GE接口,可以支持高達18000卡的大規(guī)模集群組網(wǎng)。
其次,訊飛星火認知大模型采用華為獨創(chuàng)的AI加速器,基于華為獨創(chuàng)的全局負載均衡NSLB算法、自動化開局和全??梢曔\維技術實現(xiàn)算網(wǎng)實時協(xié)同調(diào)度,在提高網(wǎng)絡吞吐的同時,能將網(wǎng)絡有效吞吐從業(yè)界的50%提升到98%,將大模型訓練效率提升20%(內(nèi)部測試數(shù)據(jù)效果)。
再次,訊飛星火認知大模型依托華為獨家網(wǎng)絡數(shù)字地圖,使能計算網(wǎng)絡一體化運維,通信異常一鍵診斷,將訓中排障效率提升了90%,大幅提高了訓練的可靠性。
在高運力底座的加持下,依托在通用人工智能領域的持續(xù)深耕和系統(tǒng)性創(chuàng)新,科大訊飛于今年5月6日正式發(fā)布星火認知大模型,并在6月9日迅速完成迭代升級,又于8月15日重磅發(fā)布訊飛星火V2.0,以驚人的速度實現(xiàn)了AI大模型的快速訓練與能力躍遷。
9月5日,訊飛星火認知大模型正式開放全民使用,14小時用戶數(shù)便突破100萬,迅速登上AppStore免費總排行榜第一。如今的訊飛星火認知大模型,已經(jīng)具有文本生成、語言理解、知識問答、邏輯推理、數(shù)學能力、代碼能力、多模態(tài)能力等7大核心能力,擁有跨領域的知識和語言理解能力,能夠基于自然對話方式理解與執(zhí)行任務。
強強聯(lián)合繼往開來,引領AI模型高性能、高安全網(wǎng)絡創(chuàng)新突破
面向未來,為了抓住AI發(fā)展浪潮契機,搶占產(chǎn)業(yè)制高點,科大訊飛和華為數(shù)據(jù)中心網(wǎng)絡繼續(xù)深化合作,共同探索產(chǎn)業(yè)發(fā)展的新道路。為此,雙方在本屆華為全聯(lián)接大會期間正式宣布“雙子星計劃”,啟動AI運力底座聯(lián)合創(chuàng)新項目,共同打造面對AI大模型場景的最佳數(shù)據(jù)中心網(wǎng)絡解決方案。
根據(jù)計劃,科大訊飛和華為數(shù)據(jù)中心網(wǎng)絡、華為網(wǎng)絡安全將繼續(xù)攜手在AI高性能網(wǎng)絡的快速部署、極致吞吐、高效運維、安全可靠等四個方向上尋求突破。三方將凝心聚力,共同推動AI大模型創(chuàng)新變革,為AI大模型接入訪問保駕護航,通過行業(yè)實踐和驗證加快AI產(chǎn)業(yè)化落地,引領社會發(fā)展的新進程。
例如,隨著越來越多用戶通過各種智能應用接入訪問AI大模型,面向智算中心與海量用戶之間的高效互聯(lián),雙方將致力于構建彈性高并發(fā)的網(wǎng)絡能力,支持彈性多路徑調(diào)度算法,從而使得網(wǎng)絡通信的性能最大化,有效地解決網(wǎng)絡擁塞問題,減少網(wǎng)絡延遲,提高網(wǎng)絡通信的可靠性,使得即使是在遙遠的鄉(xiāng)鎮(zhèn)山村也能順暢享受AI的魅力。
會上,華為還聯(lián)合中國信息通信研究院、科大訊飛正式發(fā)布了《星河AI網(wǎng)絡白皮書》(以下簡稱白皮書),闡述了星河AI網(wǎng)絡在AI大規(guī)模參數(shù)計算場景下的廣泛應用前景,并從AI業(yè)務的發(fā)展趨勢、網(wǎng)絡架構和關鍵技術創(chuàng)新三個方面展示星河AI網(wǎng)絡在人工智能產(chǎn)業(yè)的技術領導力,為構建面向AI大模型的高性能訓練網(wǎng)絡提供參考。
小結:
智能經(jīng)濟是數(shù)字經(jīng)濟發(fā)展的新階段。有報告預測,到2030年,全球智能經(jīng)濟的價值將達到18.8萬億美元。對于驅(qū)動智能未來的關鍵要素,業(yè)界已基本達成共識:AI大模型將決定智能經(jīng)濟的高度,數(shù)據(jù)價值挖掘決定智能經(jīng)濟的深度,而運力、算力和存力協(xié)同發(fā)展則將決定智能經(jīng)濟的厚度。
從中可見,科大訊飛攜手華為構筑AI大模型高運力底座,是在面向AI大模型掀起的智能經(jīng)濟大浪潮,“以網(wǎng)強算”加速行業(yè)智能化,即以高運力釋放AI時代的高算力,賦能千行百業(yè)智能化躍遷。相信隨著“雙子星計劃”的深入推進,雙方必將能為業(yè)界構筑更好的AI大模型高運力底座,加速釋放智能經(jīng)濟的巨大價值!
- 未來十年錨定混合式人工智能!楊元慶:中國依然是聯(lián)想的重中之重
- 廣州深挖昇騰+DeepSeek發(fā)展機遇,賦能百業(yè)千行智慧升級
- 谷歌不再維護AOSP?或許是想整合資源搞AI
- DeepSeek V3來了 老外評測結果:很不錯
- 對話趙少奇:為園區(qū)網(wǎng)絡注入感知能力,攜手伙伴共贏AI大時代
- 鯤鵬開源開放創(chuàng)新成效卓著,計算產(chǎn)業(yè)革新行勝于言
- 3D光電子芯片破解AI難題?新技術落地面臨三大挑戰(zhàn)
- 華為最新研判:AI已質(zhì)變,AGI正加速到來
- 他山之石!美國最流行的18個智能體(上)
- 25萬塊GPU堆出350億估值:AI“算力黃?!苯K成資本市場新寵?
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。