Token經(jīng)濟,風(fēng)起隴東

DeepSeek大火之后,為模型訓(xùn)練和推理市場帶來計算量上的大幅增長。根據(jù)黃仁勛的測算,模型推理需要的算力消耗比我們當(dāng)下以為的還要多100倍。

面對DeepSeek機遇,算力中心企業(yè)卻喜憂參半。

喜的是算力需求總量激增,DeepSeek催生了Token經(jīng)濟,算力可以像使用水電一樣按量計費,用戶根據(jù)消耗的AI算力資源(以Token為單位)付費,讓智算中心不局限于租售裸金屬的傳統(tǒng)商業(yè)模式,帶來了新的商業(yè)機會。

憂的是基于DeepSeek等模型的AI服務(wù),采用“薄利多銷”的模式,讓智算中心化身成“token工廠”,硬件與后訓(xùn)練、推理等場景需要從AI infra層面進一步調(diào)優(yōu),解決在線AI服務(wù)成本高、異構(gòu)算力統(tǒng)一納管難度大等問題。

因此,各地智算中心集群能否承接住DeepSeek催生的大量后訓(xùn)練、推理等需求,將決定token經(jīng)濟中誰主沉浮。

3月26日,“異構(gòu)智算,縱橫未來”——異構(gòu)智算產(chǎn)業(yè)生態(tài)聯(lián)盟走進燧弘華創(chuàng)慶陽綠色智算中心,共同見證了DeepSeek大模型落地的新突破,以及異構(gòu)算力在超大規(guī)模智算場景中從技術(shù)攻堅到產(chǎn)業(yè)化應(yīng)用的歷史性跨越。

硬件方面,此次慶陽項目中交付的聯(lián)想問天 WA5480 G3服務(wù)器,采用了2顆第四代英特爾?至強?可擴展處理器,內(nèi)置加速性能更進一步,可以優(yōu)化DeepSeek落地的推理表現(xiàn)。

技術(shù)方面,燧弘華創(chuàng)慶陽綠色智算中心部署了多元異構(gòu)算力調(diào)度平臺,依托聯(lián)想萬全異構(gòu)智算平臺在推理加速、訓(xùn)練優(yōu)化、斷點續(xù)訓(xùn)、內(nèi)核級虛擬化等大模型推理優(yōu)化場景的明顯優(yōu)勢,為各行業(yè)應(yīng)用DeepSeek構(gòu)建了高效能、可持續(xù)的算力底座。

借此契機,我們深入了解一下,token經(jīng)濟,為何風(fēng)起隴東。

AI算力作為數(shù)字經(jīng)濟的核心生產(chǎn)要素,其發(fā)展態(tài)勢與基礎(chǔ)設(shè)施建設(shè)緊密交織。DeepSeek點燃AI算力需求之后,作為東數(shù)西算八大國家級樞紐之一的“中國算谷”慶陽,受到了前所未有的關(guān)注。

對于慶陽數(shù)據(jù)中心企業(yè)來說,抓住DeepSeek機會,當(dāng)務(wù)之急是要把“服務(wù)器農(nóng)場”變成“token工廠”,也就是從租賃裸金屬資源的傳統(tǒng)模式,拓展按token使用量計費的新AI服務(wù)模式。

之所以出現(xiàn)這種變化,一是客戶變了,DeepSeek使得企業(yè)AI滲透率從頭部廠商向中小企業(yè)擴散,而中小企業(yè)需要的算力規(guī)模和硬件數(shù)量相對少,像水電費一樣用多少算力資源付多少錢,這種動態(tài)、輕量化的AI服務(wù),需要對異構(gòu)算力資源進行統(tǒng)一、高效、精益的納管。

二是AI任務(wù)變了,DeepSeek讓計算任務(wù)從預(yù)訓(xùn)練,轉(zhuǎn)向了后訓(xùn)練和推理,而DeepSeek的全新模型架構(gòu),硬件必須針對性地優(yōu)化、調(diào)優(yōu),不然算力服務(wù)商提供Maas服務(wù)的成本會很高,無法真的靠賣token賺到錢,AI算力也很難普惠。

與此同時,智算供應(yīng)鏈也風(fēng)云變幻。海外硬件供應(yīng)鏈也愈發(fā)不穩(wěn)定,面臨越來越嚴(yán)苛的限制,將DeepSeek部署在國產(chǎn)智算底座是大勢所趨。但國產(chǎn)硬件的架構(gòu)多、彼此生態(tài)不互通、異構(gòu)算力合池訓(xùn)練存在資源墻。

因此,慶陽的算力中心企業(yè)想要轉(zhuǎn)型“token工廠”,開拓DeepSeek服務(wù)的新商業(yè)模式,助力行業(yè)智能化,必須解決異構(gòu)智算與AI大模型深度融合的技術(shù)挑戰(zhàn)。

解決全國AI算力需求,東數(shù)西算工程正重構(gòu)算力版圖。其中,“中國算谷”慶陽備受矚目,一是算力夠用,二是算力好用。

自2023年起,慶陽持續(xù)打造算力集群基礎(chǔ)設(shè)施,目前慶陽市的總算力規(guī)模,已達5.1萬PFLOPS,從東數(shù)西算樞紐末位躍升至全國第一方陣,為數(shù)字經(jīng)濟發(fā)展筑牢“智算”底座。其中,燧弘華創(chuàng)打造的慶陽綠色智算中心,已成功構(gòu)建超2萬P的高性能算力供給規(guī)模。

讓千行百業(yè)覺得算力好用,敢于把DeepSeek接入自身場景,燧弘華創(chuàng)慶陽綠色智算中心協(xié)同聯(lián)想萬全異構(gòu)智算平臺,突破算力瓶頸,構(gòu)建了好用的異構(gòu)智算底座。

首先是算力充沛,讓千行萬業(yè)都用得上。比如此次慶陽項目中聯(lián)想問天 WA5480 G3服務(wù)器,搭載的第四代英特爾?至強?可擴展處理器,擁有強大的計算能力,內(nèi)置了眾多加速器,是智算中心建設(shè)的首選。

其次是優(yōu)化技術(shù)強,算效高、單位token的算力成本低,才能在保證模型效果的同時,實現(xiàn)算力普惠,讓中小企業(yè)或?qū)嶓w行業(yè)用得好,也用得起。

燧弘華創(chuàng)慶陽綠色智算中心作為聯(lián)想AI基礎(chǔ)設(shè)施新技術(shù)的試點之一,就充分展現(xiàn)了聯(lián)想的技術(shù)創(chuàng)新與研發(fā)的快速響應(yīng)能力,當(dāng)?shù)氐谝粫r間實現(xiàn)了兩個突破:

一是突破算力瓶頸,通過訪存優(yōu)化、顯存優(yōu)化、PCIe 5.0全互聯(lián)架構(gòu)創(chuàng)新以及精選SGLang框架中性能最優(yōu)算子等諸多領(lǐng)先創(chuàng)新方式,進一步提升單機服務(wù)器運行大模型的性能,3000并發(fā)下總吞吐量超8000 tokens/s,持續(xù)提升DeepSeek滿血版用戶體驗,刷新行業(yè)標(biāo)準(zhǔn)。

二是突破異構(gòu)算力“資源墻”。聯(lián)想萬全異構(gòu)智算平臺可以統(tǒng)一納管異構(gòu)算力,實現(xiàn)對異構(gòu)計算集群的高效管理調(diào)度和可用性保障,讓伙伴能夠為客戶提供融合、穩(wěn)定的通用、智能和科學(xué)算力。

產(chǎn)業(yè)鏈協(xié)作方面,慶陽依托異構(gòu)智算產(chǎn)業(yè)生態(tài)聯(lián)盟,得到了國產(chǎn)智算產(chǎn)業(yè)全鏈條的緊密支持,聯(lián)想萬全生態(tài)從IaaS平臺、AI訓(xùn)練與推理到行業(yè)場景解決方案的全覆蓋,為燧弘華創(chuàng)慶陽智算中心保駕護航,從而為慶陽打造東數(shù)西算模范節(jié)點注入了強勁動力。

正是在異構(gòu)智算產(chǎn)業(yè)生態(tài)的合力托舉下,慶陽得以搶占先機,憑借“夠用+好用”的算力,抓住DeepSeek落地需求,加速算力消納,真正把AI技術(shù)轉(zhuǎn)變成了當(dāng)?shù)氐膖oken經(jīng)濟紅利。

“夠用+好用”的智算集群,成就了慶陽作為國家級數(shù)算樞紐之一,從末位到第一梯隊的發(fā)展奇跡,也為當(dāng)?shù)財?shù)據(jù)中心企業(yè)探索以token使用量為主的全新商業(yè)模式,提供有力支撐。

而燧弘華創(chuàng)與聯(lián)想的結(jié)緣,就是“慶陽奇跡”的一個重要里程碑事件。雙方此前在慶陽所做的大量準(zhǔn)備工作,是慶陽智算規(guī)??焖賶汛蟮幕A(chǔ),也是隴東數(shù)字經(jīng)濟借勢Deepseek起飛的前提。

聯(lián)想作為燧弘華創(chuàng)的重要資源與伙伴,為慶陽構(gòu)建面向AI時代的基礎(chǔ)設(shè)施,帶來了四種助力:

1.先進。技術(shù)與產(chǎn)品先進,比如聯(lián)想萬全異構(gòu)智算平臺在推理加速、訓(xùn)練優(yōu)化、斷點續(xù)訓(xùn)、內(nèi)核級虛擬化等大模型推理優(yōu)化場景具有明顯優(yōu)勢,DeepSeek后訓(xùn)練場景中,調(diào)優(yōu)技術(shù)使得訓(xùn)練MFU高達60%以上;推理場景中,聯(lián)想AI服務(wù)器可以全速運轉(zhuǎn)滿血版DeepSeek R1大模型,極限吞吐量可超8000 tokens/s。這些先進技術(shù),支撐燧弘華創(chuàng)慶陽綠色智算中心,成為東數(shù)西算樞紐中第一個全智算中心,及時抓住Deepseek的AI普惠浪潮和算力需求。

2.全面。聯(lián)想正全力推進“一橫五縱”戰(zhàn)略布局,全面推出覆蓋萬全異構(gòu)智算平臺,以及涵蓋服務(wù)器、存儲、數(shù)據(jù)網(wǎng)絡(luò)、軟件及超融合、支持運維服務(wù)等在內(nèi)的全方位基礎(chǔ)設(shè)施解決方案,可以滿足燧弘華創(chuàng)建設(shè)先進綠色算力中心的一體化需求,從而加速慶陽在一年多時間內(nèi)就躋身全國“東數(shù)西算”樞紐的第一梯隊。

3.開放。萬全異構(gòu)智算平臺對通用計算集群、科學(xué)計算集群和AI算力集群進行統(tǒng)一管理,并對多種CPU、GPU、DPU等處理器進行異構(gòu)管理調(diào)度,更符合國內(nèi)落地deepseek的實際算力需求,更具前瞻性。正如英特爾高性能計算行業(yè)負(fù)責(zé)人所說,將超算與智算的能力相結(jié)合,以超智融合技術(shù)來滿足在人工智能高速發(fā)展背景下的各行業(yè)多元算力需求。這也是聯(lián)想及其伙伴的共同努力方向。

4.服務(wù)。在合作過程中,聯(lián)想24小時響應(yīng)燧弘華創(chuàng)的需求,燧弘華創(chuàng)的拼搏精神+聯(lián)想的周到服務(wù),共同推動了慶陽智算產(chǎn)業(yè)的躍升奇跡。

在萬全平臺上,構(gòu)筑算力通衢;以萬全生態(tài),護航DeepSeek落地千行百業(yè)。這是為什么token經(jīng)濟能在春節(jié)后風(fēng)起隴東,帶火了“中國算谷”慶陽。

慶陽的努力與初見成果,驗證了“token經(jīng)濟”在東數(shù)西算戰(zhàn)略下的可行性,未來可復(fù)制至其他樞紐節(jié)點。不久的將來,我們會看到在異構(gòu)智算底座上,token經(jīng)濟,風(fēng)起智能中國。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2025-04-01
Token經(jīng)濟,風(fēng)起隴東
Token經(jīng)濟,風(fēng)起隴東

長按掃碼 閱讀全文