9月18日消息(九九)“AI應(yīng)用層出不窮,算力技術(shù)飛速提升,存儲技術(shù)和產(chǎn)品發(fā)展相對緩慢,成為AI大模型訓(xùn)練過程中的性能瓶頸。”在日前舉行的2024開放數(shù)據(jù)中心大會(huì)(ODCC)上,江波龍企業(yè)級存儲事業(yè)部高級市場總監(jiān)曹潯峰在接受C114專訪時(shí)如是說。
從ChatGPT火遍全球到Sora橫空出世,AI的進(jìn)化與普及日新月異。曹潯峰指出,在此過程中,大模型參數(shù)呈指數(shù)級增長,據(jù)市場機(jī)構(gòu)分析,兩年增加410倍,“GPU算力8年增長1000倍”,與之形成鮮明對比的是,GPU內(nèi)存僅以每2年2倍的速度擴(kuò)展。緩存的容量和性能跟不上AI算力的提升。
作為在存儲市場深耕25年的“老兵”,江波龍如何迎戰(zhàn)算力產(chǎn)業(yè)發(fā)展的新趨勢?曹潯峰在訪談中分享了對于AI應(yīng)用數(shù)據(jù)存儲優(yōu)化的思考,大模型AI應(yīng)用下江波龍的企業(yè)級產(chǎn)品矩陣,并深度解讀了江波龍新近提出的PTM(存儲產(chǎn)品技術(shù)制造)模式:集芯片設(shè)計(jì)、固件開發(fā)、技術(shù)定制、封裝測試、生產(chǎn)制造于一體,實(shí)現(xiàn)從標(biāo)準(zhǔn)化產(chǎn)品到存儲產(chǎn)品一站式服務(wù)的升級跨越,打造價(jià)值合作新范式。
創(chuàng)新存儲技術(shù)與產(chǎn)品,迎戰(zhàn)萬卡AI訓(xùn)練集群
江波龍擁有嵌入式存儲、固態(tài)硬盤(SSD)、移動(dòng)存儲及內(nèi)存條四大產(chǎn)品線。產(chǎn)品廣泛應(yīng)用于主流消費(fèi)類智能終端(如智能手機(jī)、可穿戴設(shè)備、電腦等)、數(shù)據(jù)中心、汽車電子、物聯(lián)網(wǎng)、安防監(jiān)控、工業(yè)控制等領(lǐng)域,以及個(gè)人消費(fèi)類存儲零售市場。隨著AI的爆發(fā),江波龍基于自身產(chǎn)業(yè)能力與時(shí)俱進(jìn),創(chuàng)新存儲技術(shù)與產(chǎn)品滿足多樣化的市場要求。
在AI應(yīng)用實(shí)踐中,原始數(shù)據(jù)需經(jīng)過精細(xì)的清洗和預(yù)處理,轉(zhuǎn)化為高質(zhì)量的數(shù)據(jù)集,進(jìn)而通過網(wǎng)絡(luò)傳輸至AI服務(wù)器的本地SSD存儲,并最終upload至GPU HBM緩存中進(jìn)行訓(xùn)練。曹潯峰指出,隨著AI訓(xùn)練模型參數(shù)量的增長,現(xiàn)有HBM緩存和系統(tǒng)內(nèi)存RDIMM容量已難以滿足需求。“采用高性能、大容量的CXL存儲器或8x GPU卡AI服務(wù)器,將是理想的緩存優(yōu)化解決方案。”
大模型需要大算力,大算力需要大集群。據(jù)悉,江波龍正積極探索支持AIC和E3.S的JBOM系統(tǒng),并結(jié)合即將到來的支持CXL2.0服務(wù)器系統(tǒng),為萬卡AI訓(xùn)練集群提供更具成本效益的內(nèi)存池化共享硬件解決方案。
曹潯峰介紹,江波龍基于CXL協(xié)議研發(fā)了兩款存儲方案:E3.S形態(tài)CXL2.0內(nèi)存拓展模塊最大支持192GB容量,能夠適配參數(shù)量在萬億級別以下的大模型,相比業(yè)界同期水平實(shí)現(xiàn)成本大幅下降的優(yōu)勢;針對10萬億參數(shù)規(guī)模的大模型,江波龍升級研發(fā)了AIC形態(tài)、最大支持512GB內(nèi)存的拓展模塊,目前正在與一些國家級實(shí)驗(yàn)室做聯(lián)合測試,面市后將進(jìn)一步推動(dòng)AI應(yīng)用的存儲優(yōu)化。
打造企業(yè)級產(chǎn)品矩陣,攻關(guān)產(chǎn)品可靠性和穩(wěn)定性
數(shù)據(jù)中心是存儲產(chǎn)品的重要應(yīng)用領(lǐng)域,特別是隨著算力的極速發(fā)展,數(shù)據(jù)中心成為更具潛力的存儲市場。曹潯峰介紹,江波龍從2020年開始投入用于數(shù)據(jù)中心企業(yè)級存儲產(chǎn)品的研發(fā),截至目前已成功構(gòu)建了完整的企業(yè)級存儲布局,推出包括企業(yè)級PCIe 4.0 NVMe SSD、企業(yè)級SATA SSD、企業(yè)級RDIMM、CXL 2.0內(nèi)存拓展模塊在內(nèi)的多款高性能產(chǎn)品。
曹潯峰指出,對于AI服務(wù)器,企業(yè)級SSD的高性能和大容量特性,能夠有效支持復(fù)雜的機(jī)器學(xué)習(xí)模型訓(xùn)練、數(shù)據(jù)分析和內(nèi)容生成等AI應(yīng)用,加速AI計(jì)算過程,提高整體的系統(tǒng)效率和智能分析能力。同時(shí),隨著AI服務(wù)器計(jì)算密度的顯著提升,單機(jī)的功耗密度也相應(yīng)增加,不僅對服務(wù)器的能源管理提出了更高要求,也加速了SSD取代傳統(tǒng)機(jī)械硬盤(HDD)的進(jìn)程,以實(shí)現(xiàn)更優(yōu)的能效比。
曹潯峰進(jìn)一步指出,AI訓(xùn)練應(yīng)用主要涉及順序讀寫操作,QLC SSD在順序讀寫性能上與TLC相近,且成本更具優(yōu)勢。隨著PCIe Gen5帶寬的提升,QLC技術(shù)完全能夠滿足AI訓(xùn)練過程中Checkpoint數(shù)據(jù)存儲的高帶寬高并發(fā)需求,預(yù)示著QLC SSD有望成為大語言模型AI訓(xùn)練應(yīng)用的更優(yōu)選擇。曹潯峰介紹,江波龍未來有望推出更具有性價(jià)比的QLC SSD產(chǎn)品。
曹潯峰強(qiáng)調(diào):“對于企業(yè)級產(chǎn)品而言,性能并不是唯一的指標(biāo),更為關(guān)鍵的是產(chǎn)品的可靠性和穩(wěn)定性。”江波龍對此投入巨大,通過顆粒研究和測試算法等手段將產(chǎn)品的抖動(dòng)降至最低,可靠性和穩(wěn)定性具有較大的競爭優(yōu)勢。”
從標(biāo)準(zhǔn)化到定制化,PTM模式為客戶提供全棧式服務(wù)和一站式交付
訪談中,曹潯峰重點(diǎn)介紹了江波龍新近提出的PTM(存儲產(chǎn)品技術(shù)制造)模式,該模式的核心在于將公司的自研存儲控制芯片、自研固件和硬件以及自有的先進(jìn)封測制造等技術(shù)優(yōu)勢進(jìn)行無縫銜接,實(shí)現(xiàn)更靈活、高效的全棧式定制化服務(wù)和一站式交付。
不難看出,PTM模式的兩個(gè)關(guān)鍵詞分別是“全棧式定制”和“一站式交付”。與這種創(chuàng)新的商業(yè)模式相匹配的是江波龍布局多年的自主研發(fā)與智能制造能力,以及隨之構(gòu)建的高端存儲全棧能力。“存儲全棧式定制服務(wù)就像高級西裝的量身定制,每一細(xì)節(jié)都經(jīng)過一對一精心打造,確保每款產(chǎn)品方案‘裁剪’出來都能貼合、匹配客戶的獨(dú)特需求。”曹潯峰說。
在技術(shù)領(lǐng)域,江波龍擁有自主研發(fā)NAND Flash芯片、主控芯片、固件和硬件的能力,并采用多顆粒類型產(chǎn)品布局,能夠根據(jù)客戶的特定技術(shù)需求提供定制化的存儲解決方案。此外,江波龍匯聚了眾多行業(yè)資深專家,積累了豐富的技術(shù)經(jīng)驗(yàn),特別是在顆粒研究、測試算法和設(shè)備開發(fā)等方面,能夠深入分析NAND Flash和DRAM的特性,并與客戶預(yù)先確認(rèn)技術(shù)需求。通過建立專業(yè)、專項(xiàng)的FAE+AE+R&D團(tuán)隊(duì),PTM商業(yè)模式能夠幫助企業(yè)級客戶高效實(shí)現(xiàn)產(chǎn)品創(chuàng)新和大幅成本優(yōu)化,從而提升客戶的業(yè)務(wù)競爭力。
在制造方面,江波龍通過在中山存儲產(chǎn)業(yè)園、蘇州和南美洲封裝測試基地的國內(nèi)、海外雙循環(huán)產(chǎn)業(yè)鏈布局,實(shí)現(xiàn)了從存儲芯片到模組產(chǎn)品的全鏈條覆蓋。不僅保證了業(yè)內(nèi)領(lǐng)先的企業(yè)級生產(chǎn)產(chǎn)能,還實(shí)現(xiàn)了高效的全站點(diǎn)追溯能力,如同餐廳的開放式廚房,確保每道工序都可視化、透明化,讓客戶對產(chǎn)品品質(zhì)和生產(chǎn)流程擁有更為清晰而直觀的了解。
通過上述綜合措施,PTM商業(yè)模式已經(jīng)實(shí)現(xiàn)了從技術(shù)到制造再到產(chǎn)品的全方位支持,成功為華勤等客戶提供定制化的一站式交付產(chǎn)品,產(chǎn)品性價(jià)比得到客戶高度評價(jià)。
對于存儲產(chǎn)品未來的發(fā)展方向,曹潯峰認(rèn)為是存儲池化,以適應(yīng)AI大模型應(yīng)用發(fā)展的緩存需求。曹潯峰表示,江波龍將聚焦于開發(fā)性能更好、容量更大、成本更低存儲產(chǎn)品,并引入QLC NAND Flash作為資源補(bǔ)充,以滿足不同客戶的差異化需求,與產(chǎn)業(yè)鏈合作伙伴共同推動(dòng)算力產(chǎn)業(yè)進(jìn)步。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 國家發(fā)改委成立低空經(jīng)濟(jì)發(fā)展司
- 什么是人工智能網(wǎng)絡(luò)? | 智能百科
- 工信部:2025年推進(jìn)工業(yè)5G獨(dú)立專網(wǎng)建設(shè)
- 人工智能如何改變?nèi)蛑悄苁謾C(jī)市場
- 企業(yè)網(wǎng)絡(luò)安全挑戰(zhàn)頻出?Fortinet 給出破解之法
- 2025年生成式人工智能將如何影響眾行業(yè)
- 報(bào)告:人工智能推動(dòng)數(shù)據(jù)中心系統(tǒng)支出激增25%
- 千家早報(bào)|馬斯克預(yù)測:人工智能或?qū)⒊絾蝹€(gè)人類;鴻蒙生態(tài)(武漢)創(chuàng)新中心啟用,推動(dòng)鴻蒙軟硬件在武漢首試首用——2024年12月27日
- 中移建設(shè)被拉入軍采“黑名單”
- 大理移動(dòng)因違規(guī)套現(xiàn)等問題,擬被列入軍采失信名單
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。