采寫/王舒然
編輯/萬天南
在大模型甚囂塵上的當(dāng)下,一向高舉高打的字節(jié),卻一反常態(tài),低調(diào)得讓人不太習(xí)慣。
當(dāng)百度、阿里、華為、360等知名互聯(lián)網(wǎng)公司的一把手們親自掛帥,為大模型站臺(tái),并不吝用“智能化時(shí)代的開端”、“科技和商業(yè)史上的革命性時(shí)刻”來贊譽(yù)它時(shí),字節(jié)卻安靜得多。
相關(guān)的官宣只有兩個(gè),一是4月11日,飛書宣布將推出AI助手“My AI”,二是4月18日,火山引擎推出大模型訓(xùn)練云平臺(tái),包括自研DPU(數(shù)據(jù)處理器)、新版機(jī)器學(xué)習(xí)平臺(tái)等系列云產(chǎn)品,以服務(wù)于大模型創(chuàng)業(yè)公司——字節(jié)自研大模型始終未露面。
相反的是,火山引擎總裁譚待公開“承諾”,火山引擎不做大模型,將化身賦能者,為大模型客戶提供算力等AI基礎(chǔ)設(shè)施,幫助其做好大模型開發(fā)。
此舉似乎表明,字節(jié)避開了大模型戰(zhàn)火,選擇以幕后賣水者的身份入局。
只是,在算力、算法、數(shù)據(jù)這大模型的三要素上均具備優(yōu)勢(shì)的字節(jié),為何會(huì)選擇“韜光養(yǎng)晦”?字節(jié)真的會(huì)徹底放棄大模型,甘為他人做“嫁衣”嗎?
慢一拍的字節(jié)大模型
火山引擎不做大模型,或許并不代表字節(jié)對(duì)大模型無動(dòng)于衷,這可能是個(gè)文字游戲。
實(shí)際上,雖然字節(jié)從未大張旗鼓得官宣自研大模型,但已經(jīng)有所部署。
據(jù)36Kr在今年2月的報(bào)道,字節(jié)跳動(dòng)在大模型上已有布局,會(huì)在語言和圖像兩方面發(fā)力,語言大模型團(tuán)隊(duì)由字節(jié)搜索部門牽頭,目前團(tuán)隊(duì)規(guī)模在十?dāng)?shù)人左右;圖片大模型團(tuán)隊(duì)則由產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團(tuán)隊(duì)牽頭。
另據(jù)《晚點(diǎn)LatePost》報(bào)道,張一鳴開始看人工智能論文,且時(shí)常會(huì)和一些字節(jié)人士分享論文心得和對(duì)ChatGPT的思考。
這表明,字節(jié)并不想缺席這場(chǎng)盛宴,但必須承認(rèn)的是,字節(jié)在大模型上的反應(yīng)確實(shí)有點(diǎn)“遲鈍”了。
民生證券4月9日發(fā)布的《當(dāng)大模型不再稀缺》報(bào)告顯示,國內(nèi)至少已有30多家大模型亮相。大部分都在3~4月份官宣,比如3月16日的百度“文心一言”大模型,4月8日的華為盤古系列AI大模型,4月10日的商湯“日日新”大模型,4月11日的阿里“通義千問”大模型......
而據(jù)36Kr報(bào)道,字節(jié)語言大模型團(tuán)隊(duì)今年初才成立,預(yù)期今年年中推出大模型,字節(jié)跳動(dòng)相關(guān)技術(shù)負(fù)責(zé)人表示,技術(shù)中臺(tái)在這些領(lǐng)域的探索仍處于初期,尚未成熟。
事實(shí)上,大模型競(jìng)賽的起點(diǎn)并非今天,而在更早的布局,這方面,字節(jié)有些晚了。
對(duì)比來看,百度、阿里、華為、騰訊等企業(yè)的大模型均在2019年~2021年間就已有雛形,比如,百度在2019年發(fā)布了文心大模型,阿里在2021年發(fā)布了M6大模型,同年華為發(fā)布盤古大模型,這些雛形可以視為近期發(fā)布的類ChatGPT大模型的“基座”。
而字節(jié)方面,雖然其AI布局不算晚,字節(jié)AI Lab早在2016年就成立,與騰訊同一年,但其似乎并未在大模型上下足功夫。
據(jù)《晚點(diǎn)LatePost》報(bào)道,一位字節(jié)人士稱,在去年底ChatGPT出現(xiàn)前,字節(jié)對(duì)大模型的投入還比較少,表現(xiàn)之一是,約有100人的字節(jié)AI Lab NLP(自然語言處理)組,只有不到10人在研究語言大模型,其他人主要在做翻譯和抖音安全等優(yōu)化。
知乎上一位字節(jié)AI Lab工程師的回答也印證了這一點(diǎn),他表示,字節(jié)AI Lab的主要研究方向和業(yè)務(wù)應(yīng)用有關(guān),比如抖音特效、視頻和圖片審核等。
簡(jiǎn)單來說,字節(jié)對(duì)AI的探索比較務(wù)實(shí),主要服務(wù)于自家業(yè)務(wù),這種務(wù)實(shí)而非務(wù)遠(yuǎn)的策略,或許反而成了其布局通用大模型的“阻礙”。
而除了晚一步之外,字節(jié)對(duì)大模型的野望似乎也不是很大。
據(jù)《晚點(diǎn)LatePost》報(bào)道,字節(jié)語言大模型的探索方向主要與搜索相關(guān),可能會(huì)在抖音、TikTok中推出類似微軟New Bing的功能;圖像大模型則主要服務(wù)商業(yè)化需求,以幫助字節(jié)的廣告客戶以更低成本制作視頻。
另據(jù)字母榜報(bào)道,有知情人士稱,飛書推出的“My AI”背后的大模型是由飛書自行操盤,而非字節(jié)大模型團(tuán)隊(duì)負(fù)責(zé)。
從上述信息判斷,字節(jié)大模型似乎并不打算“大包大攬”,而是與自家部分業(yè)務(wù)緊密相關(guān),這與百度“文心一言”、阿里“通義千問”等通用大模型有所差別。
比如“文心一言”,在發(fā)布會(huì)現(xiàn)場(chǎng),文心一言展示了五個(gè)使用場(chǎng)景,包括文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成。
“通義千問”的功能則包括多輪對(duì)話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持等,阿里巴巴集團(tuán)董事會(huì)主席兼首席執(zhí)行官張勇表示,阿里所有業(yè)務(wù)包括天貓、釘釘、高德地圖、淘寶、優(yōu)酷、盒馬等都將接入該模型,應(yīng)用場(chǎng)景實(shí)屬廣泛。
另一個(gè)可以側(cè)面佐證這一點(diǎn)的是,百度和阿里均計(jì)劃依托自家云平臺(tái),向外界開放大模型服務(wù),打造大模型生態(tài)。
比如阿里云智能集團(tuán)CTO周靖人表示,各行各業(yè)的生態(tài)伙伴都可以對(duì)千問大模型進(jìn)行再訓(xùn)練和精調(diào),打造行業(yè)專屬大模型;百度智能云事業(yè)群總裁沈抖也表示,文心一言的能力將通過百度智能云對(duì)外提供服務(wù),會(huì)率先在媒體、文娛、企業(yè)軟件等行業(yè)落地,場(chǎng)景包括智能客服、員工培訓(xùn)、巡檢日?qǐng)?bào)、知識(shí)萃取等。
但字節(jié)云卻“反其道而行之”,火山引擎宣稱只做基礎(chǔ)設(shè)施服務(wù),不對(duì)外輸出大模型能力。
這意味著,字節(jié)正在探索的大模型定位可能并非是開放生態(tài),而是為了增強(qiáng)現(xiàn)有業(yè)務(wù)的競(jìng)爭(zhēng)力。
當(dāng)然,這只是初期,字節(jié)大模型的全貌尚未揭開,在字節(jié)官宣之前,還是變數(shù)難料。
字節(jié)為何甘為他人做“嫁衣“?
值得探究的是,為何字節(jié)對(duì)百度、阿里那樣的通用大模型興趣不高?火山引擎又為何堅(jiān)定得不做大模型?
背后原因或許與以下幾方面的權(quán)衡有關(guān):
其一,通用大模型燒錢,且距離商業(yè)落地“遙遠(yuǎn)”。
訓(xùn)練大模型的一大成本是算力,而算力的關(guān)鍵是芯片,那么,大模型訓(xùn)練需要多少芯片?
參考ChatGPT,美國市場(chǎng)研究機(jī)構(gòu)TrendForce推算稱,處理ChatGPT的訓(xùn)練數(shù)據(jù)需要2萬枚A100芯片。網(wǎng)上流傳的一份《AI芯片專家交流紀(jì)要》顯示,如果是對(duì)標(biāo)ChatGPT的大模型,1萬顆A100芯片是入門券。
而據(jù)國盛證券估算,按單張A100芯片的價(jià)格為10萬元算,大模型訓(xùn)練需要投入約10億元。
這還只是訓(xùn)練階段的芯片成本,還有模型推出后的綜合運(yùn)營成本,參考ChatGPT,半導(dǎo)體研究公司SemiAnalysis認(rèn)為,GPT-3每天大規(guī)模服務(wù)用戶的運(yùn)營成本高達(dá)70萬美元,一年則高達(dá)2.555億美元(約17.6億元人民幣),新一代的GPT-4模型只會(huì)更燒錢。
除此外,還有數(shù)據(jù)采集、人工標(biāo)注等軟性成本,加起來可謂“天價(jià)”。
像字節(jié)這樣的大廠或許有資金實(shí)力,但麻煩的是,燒錢的結(jié)果面臨不確定性。
雖然大模型前景可瞻,但距離大規(guī)模的商業(yè)落地還有不小的距離,目前仍在摸索階段,除了像釘釘、飛書、印象筆記等辦公場(chǎng)景的具體落地外,其他的應(yīng)用場(chǎng)景都還停留在展望階段。
創(chuàng)世伙伴CCV合伙人梁宇在接受《21世紀(jì)經(jīng)濟(jì)報(bào)道》采訪時(shí)表示,現(xiàn)在是通用人工智能商業(yè)化應(yīng)用的前夜,AI大模型還沒有經(jīng)過大量的商業(yè)包裝和訓(xùn)練,需要從業(yè)者像園藝師一樣去修剪,形成符合行業(yè)規(guī)律的商業(yè)化產(chǎn)品。
IDC中國研究總監(jiān)盧言霞則認(rèn)為,大模型落地的不確定性在于,能不能成功落地,是否真的能產(chǎn)出比之前的AI更好的效果,需要多久才能落地等等。
通用大模型投入產(chǎn)出比的不確定性,或許會(huì)讓“ROI至上”的字節(jié)有所顧慮。
其二,時(shí)間就是力量,在過去幾年內(nèi),阿里、百度等企業(yè)已將大模型“基座”迭代過幾輪,而字節(jié)幾乎是從“零”開始,先發(fā)優(yōu)勢(shì)已失,追趕不易,不如務(wù)實(shí)一點(diǎn)。
如今,字節(jié)大模型聚焦搜索、視頻生成等場(chǎng)景,離自身的業(yè)務(wù)落地更近,在算法和數(shù)據(jù)的儲(chǔ)備上極具優(yōu)勢(shì),可操作性更高。
火山引擎定位基礎(chǔ)設(shè)施的服務(wù)也是同理,其2021年開始切入IaaS(基礎(chǔ)設(shè)施服務(wù))模式,至今也有一定積累。
且網(wǎng)上流傳的一份《阿里云AI專家交流紀(jì)要0401》顯示,在國內(nèi)大廠的AI算力儲(chǔ)備中,字節(jié)排名第二,僅次于阿里。
更重要的是,火山引擎該定位的商業(yè)落地十分明確,更容易保障正向現(xiàn)金流。
這是因?yàn)榇竽P陀?xùn)練需要巨大算力支持,而云廠商是公認(rèn)的算力等基礎(chǔ)設(shè)施的最佳載體。
正如阿里巴巴集團(tuán)董事會(huì)主席兼首席執(zhí)行官張勇所言,大模型是一場(chǎng)“AI+云計(jì)算”的全方位競(jìng)爭(zhēng),超萬億參數(shù)的大模型研發(fā),是囊括了算法、底層龐大算力、網(wǎng)絡(luò)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等諸多領(lǐng)域的復(fù)雜系統(tǒng)性工程,需要超大規(guī)模AI基礎(chǔ)設(shè)施的支撐。
微軟便是先例,微軟Azure作為OpenAI的獨(dú)家云供應(yīng)商,為ChatGPT提供算力和超級(jí)計(jì)算系統(tǒng)。除了OpenAI,微軟2023財(cái)年二季度財(cái)報(bào)電話會(huì)議顯示,安盛、聯(lián)邦快遞和H&R Block等公司也都選擇Azure來部署和管理其模型。
像微軟這樣的云廠商被喻為大模型時(shí)代的“賣水人”,意為在大模型淘金的人未必能賺到錢,但為淘金人提供基礎(chǔ)服務(wù)的肯定能賺到。
硅谷知名風(fēng)投A16Z的研究印證了這一點(diǎn):生成式AI的大量資金最終都穩(wěn)定地流向了基礎(chǔ)設(shè)施層,預(yù)計(jì)生成式AI總收入的10%~20%都流向了云提供商。
總之,商業(yè)落地風(fēng)險(xiǎn)小,自身又擅長,無怪乎火山引擎如此定位,而抓住這股“紅利”,有機(jī)會(huì)為其帶來新的市場(chǎng)增量。
在目前的云市場(chǎng)中,火山引擎還排不上名次,IDC最新發(fā)布的《中國公有云服務(wù)市場(chǎng)(2022 下半年)跟蹤》報(bào)告顯示,目前公有云服務(wù)市場(chǎng)的市場(chǎng)份額排名前五名分別為:阿里云、華為云、中國電信天翼云、騰訊云和AWS,它們總共占據(jù)了72%以上的市場(chǎng)份額,其余的云服務(wù)廠家份額有限。
或許,以基礎(chǔ)服務(wù)切入大模型戰(zhàn)場(chǎng)的火山引擎,未來有機(jī)會(huì)借此一搏新的市場(chǎng)格局。
火山引擎或遇天花板
目前看,火山引擎這條路走得還算順利?;鹕揭婵偛米T待表示,目前國內(nèi)有數(shù)十家做大模型的企業(yè),七成已經(jīng)在火山引擎云上,包括AI技術(shù)公司MiniMax、智譜AI、昆侖萬維、毫末智行等。
關(guān)于“七成”的數(shù)據(jù)口徑,譚待的解釋是,該“七成”是火山引擎相關(guān)客戶與第三方機(jī)構(gòu)統(tǒng)計(jì)的大模型企業(yè)數(shù)量之比,而能獲得這么多客戶是因?yàn)闄C(jī)器學(xué)習(xí)平臺(tái)解決了算力輔助的問題。
這些客戶案例表明,火山引擎在大模型訓(xùn)練領(lǐng)域已有一定立足之地。
不過,從長遠(yuǎn)看,火山引擎也面臨挑戰(zhàn)。
一方面,有能力做大模型的公司畢竟是少數(shù),客戶規(guī)模的天花板很明顯。
據(jù)譚待透露,在火山引擎的大模型客戶中,通用大模型公司占比大約為三分之一,垂直行業(yè)公司占比約為三分之二。
分別來看,在通用大模型方面,雖然目前創(chuàng)業(yè)者眾,但大浪淘沙,最終留下的能有幾何?
一位互聯(lián)網(wǎng)投資人認(rèn)為,中國版ChatGPT只會(huì)在5家公司里產(chǎn)生:BAT+字節(jié)+華為,因?yàn)榇髲S有錢有人有場(chǎng)景。
北京航空航天大學(xué)人工智能研究院教授吳文峻也有類似觀點(diǎn),其在接受《中新經(jīng)緯》采訪時(shí)表示,在目前宣布進(jìn)軍大模型的三四十家企業(yè)中,最后能做成的或許不超過一半。
當(dāng)客戶數(shù)量有明顯的天花板時(shí),火山引擎的前景可能也有了“瓶頸”。
而在垂直行業(yè)模型方面,客戶數(shù)量雖然很多,但也可能面臨阿里云、百度云等平臺(tái)的“狙擊”。
原因在于,阿里云、百度云均自帶通用大模型輸出的能力,基于此,企業(yè)可更方便的生成垂直模型。
比如阿里云,阿里云智能集團(tuán)CTO周靖人在此前的媒體采訪中表示,阿里云會(huì)為企業(yè)提供一個(gè)專屬數(shù)據(jù)空間,企業(yè)將相關(guān)信息存入,且不需要做任何數(shù)據(jù)預(yù)處理,便可調(diào)用“通義千問”,一鍵式生成自己的行業(yè)專屬大模型。
而如果在沒有大模型的火山引擎上做垂直模型訓(xùn)練,企業(yè)要操心的事顯然更多。
上述投資人認(rèn)為,垂直模型企業(yè)一般很少會(huì)自己從頭做,而是找一個(gè)還不錯(cuò)的Pre-Train過的大模型,在此基礎(chǔ)上做Instruction Tuning(指令微調(diào))。
在此方面,阿里云等平臺(tái)可能更有優(yōu)勢(shì)。
另一方面,未來云廠商的模式可能是賣模型+賣算力,而不只是賣算力。
Maas模型即服務(wù)的時(shí)代已經(jīng)到來,阿里云、百度云不僅支持專屬行業(yè)模型的生成,還支持中小企業(yè)甚至個(gè)人基于大模型直接開發(fā)應(yīng)用,這就好比個(gè)人開發(fā)者基于安卓操作系統(tǒng)開發(fā)App。
換句話說,模型層在未來可能成為新的基礎(chǔ)設(shè)施。
李彥宏在36Kr專訪中更是斷言,未來企業(yè)在購買云計(jì)算時(shí),不看底層算力,而是看大模型的優(yōu)劣。
這可能給火山引擎帶來一定沖擊,因?yàn)楫?dāng)大量中小企業(yè)或個(gè)人基于阿里云、百度云開發(fā)應(yīng)用時(shí),云廠商背后的算力也得到了間接調(diào)用,從而規(guī)模效應(yīng)平攤了算力成本,最終使其基礎(chǔ)設(shè)施層面的服務(wù)也更具價(jià)格優(yōu)勢(shì),這頗有點(diǎn)“降維打擊”的意思。
事實(shí)上,“價(jià)格戰(zhàn)”已經(jīng)開始了。
4月26日,在2023阿里云合作伙伴大會(huì)上,阿里云推出了史上最大規(guī)模的降價(jià):核心產(chǎn)品價(jià)格全線下調(diào),降幅最高至50%。
不過,火山引擎對(duì)此好像比較樂觀,至少現(xiàn)階段如此。
其邏輯在于,一來火山引擎拿到的時(shí)間窗口還比較長,譚待認(rèn)為,國內(nèi)距離全球最高水平的大模型還需要比較長的時(shí)間,現(xiàn)階段不可能用三四十分的模型去做應(yīng)用,也不可能做好應(yīng)用。
二來,火山引擎堅(jiān)信未來是多云多模型時(shí)代,企業(yè)會(huì)避免單一依賴,而選擇使用多家云服務(wù),同時(shí),各行業(yè)都有自己高質(zhì)量的私有語料,會(huì)形成多模型生態(tài)。
言下之意可能是,市場(chǎng)很大,火山引擎總會(huì)有立足之地。
總而言之,大模型市場(chǎng)的未來撲朔迷離,參與其中的任何一員的前途均可能有變數(shù),“缺失”大模型的火山引擎如此,走務(wù)實(shí)路線的字節(jié)大模型也如此。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 大廠AI軍備烽火再起,但它們到底在押注什么
- 美國“對(duì)等關(guān)稅”坑慘蘋果:每年損失330億美元,產(chǎn)業(yè)鏈大逃殺
- 368元吸氧一小時(shí)?中年男人愛上高壓氧,店主:他們手里有錢
- 產(chǎn)業(yè)互聯(lián)網(wǎng),一次B端和C端的雙向奔赴
- 奇富科技與香港特區(qū)政府簽約成為重點(diǎn)企業(yè)
- 全網(wǎng)吹爆的大模型家電,真的值得種草嗎?
- 鏖戰(zhàn)企業(yè)級(jí)市場(chǎng),AI Agent如何重塑智能商業(yè)未來?
- 阿里、騰訊們用AI讓產(chǎn)業(yè)互聯(lián)網(wǎng)「成真」
- 劉興亮 | 記一位突然離去的多年老友
- 關(guān)稅嚇人,美國人搶購中國商品,蘋果慌了,緊急包機(jī)運(yùn)iPhone
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。