大模型冷思考:企業(yè)“可控”價(jià)值創(chuàng)造空間還有多少?

文 | 智能相對(duì)論

作者 | 葉遠(yuǎn)風(fēng)

毫無(wú)疑問(wèn),大模型熱潮正一浪高過(guò)一浪。

在發(fā)展進(jìn)程上,從最開(kāi)始的技術(shù)比拼到現(xiàn)在已開(kāi)始全面強(qiáng)調(diào)商業(yè)價(jià)值變現(xiàn),百度、科大訊飛等廠商都喊出類似“不能落地的大模型沒(méi)有意義”等口號(hào)。

在模型類型上,除了百度文心大模型、訊飛星火認(rèn)知大模型、阿里通義千問(wèn)大模型等通用大模型,醫(yī)藥研發(fā)、金融等垂直大模型正積極涌現(xiàn)。幾個(gè)月前,新華三集團(tuán)在業(yè)內(nèi)首提“私域大模型”概念,并發(fā)布融合了行業(yè)屬性及地域?qū)傩缘乃接虼竽P汀鞍贅I(yè)靈犀”LinSeer,為行業(yè)增添了企業(yè)落地大模型的創(chuàng)新類型。

而在更直接的數(shù)字上,截止到2023年10月初,國(guó)內(nèi)僅公開(kāi)的大模型數(shù)量已達(dá)238個(gè),百模大戰(zhàn)正在升級(jí)千模大戰(zhàn)。

……接近一年的熱潮后大模型沒(méi)有冷卻的跡象,行業(yè)普遍的共識(shí)形成,這不是風(fēng)口,而是技術(shù)革命。

然而,歷史一次次證明,賽道越是熱鬧,參賽者越需要冷靜的思考。

種種跡象顯示,雖然看起來(lái)百花齊放,但事實(shí)上AI三大要素(算力、數(shù)據(jù)、算法),以及大模型發(fā)展的行業(yè)規(guī)則中,當(dāng)下以及未來(lái)很多因素已經(jīng)既定,一頭熱扎進(jìn)去的企業(yè)們,更應(yīng)該尋找的是那些不由既成的客觀因素所限制、能夠進(jìn)行自我價(jià)值發(fā)揮的地方,才能盡可能獲得相對(duì)競(jìng)爭(zhēng)優(yōu)勢(shì)。

算力“積木化”,可控價(jià)值創(chuàng)造集中到“調(diào)度”環(huán)節(jié)

算力常常被視為大模型發(fā)展的瓶頸問(wèn)題,但是,如果從是否“可控”的視角看,在業(yè)務(wù)層面企業(yè)能自己做出決定從而影響算力獲取的地方,其實(shí)越來(lái)越少。

IT時(shí)代Windows+Intel構(gòu)建起WinTel體,演變?yōu)橐苿?dòng)互聯(lián)網(wǎng)時(shí)代安卓+ARM(以高通為代表),到了大模型時(shí)代,又進(jìn)一步演化為AI大模型+GPU——在當(dāng)前,Nvidia已經(jīng)成為大模型趨同的算力來(lái)源。

2021的Ampere(對(duì)應(yīng)A100等)、2022年的Hopper(對(duì)應(yīng)H100等)、2023的Ada架構(gòu)……性價(jià)比高不高,要看Nvidia架構(gòu)發(fā)展有多快。

算力不再是瓶頸,或者說(shuō),其“總體基本面”的提升并沒(méi)有什么操作空間——要多少算力就需要多少資本投入,反過(guò)來(lái)有多少資本投入基本也能買來(lái)多少算力。

當(dāng)算力“口子”被外部技術(shù)、內(nèi)部預(yù)算等限定,通過(guò)調(diào)度提升既有資源利用效率,就成為企業(yè)“可控”的價(jià)值創(chuàng)造過(guò)程。特別是私域大模型,對(duì)于企業(yè)來(lái)說(shuō),AI大模型的大小需要平衡算力和能耗的開(kāi)支,應(yīng)選擇適合行業(yè)特點(diǎn)和業(yè)務(wù)特點(diǎn)的大模型進(jìn)行私域部署。

此時(shí),如何榨取硬件資源提供的每一滴能力,加速模型的訓(xùn)練速度成為首要考慮的問(wèn)題,而這方面術(shù)業(yè)有專攻,往往依賴基礎(chǔ)設(shè)施服務(wù)廠商——針對(duì)算力等底層基礎(chǔ)設(shè)施提供支撐成為考驗(yàn)各個(gè)服務(wù)廠商最基本的能力,其中尤以算力調(diào)度能力是其重點(diǎn)。

算力調(diào)度往往需要多維能力協(xié)同,所以,作為業(yè)內(nèi)首倡私域大模型的新華三給出了自己的回答:依托通過(guò)傲飛算力平臺(tái)實(shí)現(xiàn)算力調(diào)度的“最優(yōu)解”,讓算力可以最大化的按需調(diào)度。另一方面以綠洲平臺(tái)實(shí)現(xiàn)大模型所需的數(shù)據(jù)支撐,同時(shí)在分布式訓(xùn)練等需求下以智能無(wú)損網(wǎng)絡(luò)支持AI集群訓(xùn)練,配備高性能存儲(chǔ)帶來(lái)更好的底層存儲(chǔ)支撐,甚至還建設(shè)有液冷數(shù)據(jù)中心來(lái)維持算力輸出的穩(wěn)定性,以此構(gòu)成一套完整的智算解決方案。

而新華三算力調(diào)度的“主腦”傲飛算力平臺(tái)則具備異構(gòu)計(jì)算資源統(tǒng)一管理、多元算力資源智能調(diào)度的能力,提供包含智能標(biāo)注、智能訓(xùn)練、智能調(diào)優(yōu)、智能部署、智能推理的全流程算力智能調(diào)度能力。

按官方數(shù)據(jù),該平臺(tái)能夠?qū)⑺懔寐侍岣咧?0%以上。同時(shí),還支持8000節(jié)點(diǎn)的算力調(diào)度,并發(fā)訓(xùn)練時(shí)間縮短至50%,且斷點(diǎn)自動(dòng)接續(xù)無(wú)感知訓(xùn)練更穩(wěn)定,在既有GPU資源下能全方面提升大模型訓(xùn)練性能。

說(shuō)白了,就是通過(guò)一系列算力流程環(huán)節(jié)的銜接優(yōu)化(尤其是面對(duì)并行計(jì)算與分布式計(jì)算需求),在充分保障訓(xùn)練與應(yīng)用需求的同時(shí)降低GPU的空閑時(shí)間,讓巨大成本獲取來(lái)的算力資源工作盡可能飽和。

總體而言,這一整套高性能算力集群及調(diào)度讓客戶能夠?qū)崿F(xiàn)算力、存力、運(yùn)力協(xié)同感知,實(shí)現(xiàn)算力資源充分供給、靈活部署、異構(gòu)算力最優(yōu)調(diào)度——雖然有多少算力資源很難控制,但用好這些資源企業(yè)卻能夠做到完全可控。

當(dāng)然,除了提升算力利用效率,行業(yè)中一些做法還在試圖通過(guò)其他方式直接降低模型訓(xùn)練對(duì)GPU資源的要求,例如數(shù)據(jù)存儲(chǔ)層面進(jìn)行算子優(yōu)化等,未來(lái)或也存在較大的價(jià)值開(kāi)發(fā)空間。

數(shù)據(jù)“斷面化”,以數(shù)據(jù)質(zhì)量建設(shè)帶來(lái)“護(hù)城河”成為企業(yè)的必然選擇

目前,企業(yè)能夠獲得的數(shù)據(jù)量來(lái)源主要包括公開(kāi)的數(shù)據(jù)集與自身沉淀。

在當(dāng)下時(shí)間斷面,這兩種都只能被動(dòng)等待或由時(shí)間積累,數(shù)據(jù)“量”其實(shí)很難有突破,優(yōu)勢(shì)有就是有,沒(méi)有就是沒(méi)有,并不可控。

當(dāng)然,也有一些企業(yè)試圖主動(dòng)出擊,例如國(guó)外公司Inflection AI以大規(guī)模提問(wèn)的方式來(lái)主動(dòng)提升數(shù)據(jù)沉淀速度,但這顯然這并不會(huì)是主流。

“量”上不可控,則可控的價(jià)值創(chuàng)造空間必須更聚焦于“質(zhì)”上。

中信智庫(kù)《人工智能十大發(fā)展趨勢(shì)》認(rèn)為,“未來(lái)一個(gè)模型的好壞,80%由數(shù)據(jù)質(zhì)量決定?!?/p>

從長(zhǎng)遠(yuǎn)視角看,大模型的競(jìng)爭(zhēng)并不是要比誰(shuí)跑得更快,而是比誰(shuí)走得更遠(yuǎn),這就需要大模型真實(shí)的應(yīng)用效果,也就需要通過(guò)各種方式提升數(shù)據(jù)質(zhì)量,來(lái)鍛造大模型發(fā)展的“內(nèi)功”。

在數(shù)據(jù)的計(jì)劃、獲取、存儲(chǔ)、共享、維護(hù)、應(yīng)用等環(huán)節(jié),都需要針對(duì)性的數(shù)據(jù)管理、治理,最終提升數(shù)據(jù)質(zhì)量。這是一個(gè)系統(tǒng)性工程,也為市面上的基礎(chǔ)設(shè)施服務(wù)商們帶來(lái)了機(jī)會(huì)。

例如新華三的綠洲平臺(tái)就以場(chǎng)景需求為導(dǎo)向,打造了一個(gè)圍繞數(shù)據(jù)采集、存儲(chǔ)、管理和應(yīng)用的全棧數(shù)據(jù)平臺(tái)。

通過(guò)內(nèi)置AI算法,綠洲平臺(tái)大大提升了數(shù)據(jù)標(biāo)記能力,讓數(shù)據(jù)治理、數(shù)據(jù)開(kāi)發(fā)等過(guò)去很繁雜的流程工作變得極為簡(jiǎn)單,而知識(shí)圖譜構(gòu)建能力則幫助數(shù)據(jù)躍升為知識(shí),從而能夠更好地被業(yè)務(wù)場(chǎng)景所使用。

事實(shí)上,數(shù)據(jù)深加工帶來(lái)高質(zhì)量數(shù)據(jù)訓(xùn)練一直是前沿大模型的核心競(jìng)爭(zhēng)力所在,OpenAI一貫公開(kāi)其訓(xùn)練過(guò)程及算法,但對(duì)數(shù)據(jù)如何處理緘口不言。

回過(guò)頭來(lái)看,數(shù)據(jù)的“要素化”與“資產(chǎn)化”正在讓百行百業(yè)再次審視數(shù)據(jù)的價(jià)值,在數(shù)據(jù)越來(lái)越作為一種新型生產(chǎn)力要素的時(shí)代,大模型的本質(zhì)可以視作一種挖掘數(shù)據(jù)要素價(jià)值的工具,而工具不決定價(jià)值,只決定效率。

大模型終將走入底層成為一種普遍的后端能力,技術(shù)本身越來(lái)越無(wú)法成為護(hù)城河,而數(shù)據(jù)則代表了企業(yè)在前端與客戶/用戶的連接程度,數(shù)據(jù)要素的價(jià)值釋放將成為企業(yè)真正的“護(hù)城河”。

所有的數(shù)據(jù)類平臺(tái)提升數(shù)據(jù)質(zhì)量的過(guò)程,就是在幫助企業(yè)進(jìn)一步挖掘數(shù)據(jù)要素價(jià)值、沉淀數(shù)據(jù)資產(chǎn),真正打造企業(yè)的“護(hù)城河”。

算法“收斂化”,殊途同歸下企業(yè)需聚焦訓(xùn)練效率提升

算法是大模型的能力核心,但長(zhǎng)期來(lái)看,算法能力卻終將“收斂”。

目前的大模型算法基本上都基于Transformer架構(gòu),該架構(gòu)解決了過(guò)去RNN架構(gòu)難以并行化等核心缺陷,是基因“優(yōu)勝劣汰”的結(jié)果,BERT、GPT、T5、GLM等都其“衍生品”。

所以,算法生來(lái)都幾乎有著相同的“基因”。

而在開(kāi)發(fā)框架層面,伴隨著開(kāi)源生態(tài)建設(shè),國(guó)外的TensorFlow、Pytorch,國(guó)內(nèi)的MindSpore等幾個(gè)主流框架逐步成為共同的選擇。

這意味著,算法的后天的“成長(zhǎng)環(huán)境”也逐步趨同。

先天+后天,算法創(chuàng)新當(dāng)下看起來(lái)百花齊放,但在未來(lái)其價(jià)值創(chuàng)新的空間將逐步收窄,企業(yè)能夠通過(guò)努力獲得的相對(duì)優(yōu)勢(shì)將越來(lái)越少。

甚至,在Llama 2掀起的開(kāi)源浪潮下,算法創(chuàng)新的價(jià)值被進(jìn)一步壓縮。

因此,從長(zhǎng)期來(lái)看,企業(yè)最“可控”的價(jià)值創(chuàng)造將側(cè)重到訓(xùn)練效率而非算法創(chuàng)新上——同樣的能力與潛力,PK更快速地訓(xùn)練迭代。

很多廠商提供的開(kāi)發(fā)工具鏈都在直接推進(jìn)訓(xùn)練效率,而一些原本旨在提供算力服務(wù)的平臺(tái)也實(shí)現(xiàn)了等價(jià)的功能。

例如,傲飛算力平臺(tái)支持?jǐn)帱c(diǎn)自動(dòng)接續(xù)無(wú)感知訓(xùn)練,其原本目的在于降低參數(shù)迭代期間的GPU資源等待、提升資源利用效率,但客觀上也直接帶來(lái)訓(xùn)練效率的提升,讓算法加速迭代,先把潛力跑出來(lái)。

畢竟,加速算法訓(xùn)練,就是在提升算力資源利用效率。

行業(yè)規(guī)則“沉淀化”:長(zhǎng)期主義仍需回歸到正確的價(jià)值觀

大模型熱潮中,人人都會(huì)不自覺(jué)追求技術(shù)與商業(yè)價(jià)值“上限”,但大模型“下限”問(wèn)題也日益突出,例如數(shù)據(jù)隱私、數(shù)據(jù)安全、知識(shí)產(chǎn)權(quán)、技術(shù)濫用等。

從企業(yè)的視角看,行業(yè)規(guī)則建立迫在眉睫,但其形成過(guò)程同樣存在著不由企業(yè)決定的“客觀因素”。

關(guān)于行業(yè)發(fā)展的一些法律法規(guī),監(jiān)管部門在逐步沉淀,例如國(guó)家網(wǎng)信辦聯(lián)合多部門公布的《生成式人工智能服務(wù)管理暫行辦法》,企業(yè)要做的是等待并盡力配合與落實(shí)。

關(guān)于行業(yè)統(tǒng)一共識(shí),也需要一個(gè)個(gè)沉淀,例如,目前已經(jīng)有從業(yè)者提議行業(yè)協(xié)作開(kāi)發(fā)統(tǒng)一、可信的框架,在隱私保護(hù)、模型效用和訓(xùn)練效率之間取得平衡,企業(yè)要做的是積極響應(yīng)、積極參與。

但在一些規(guī)則上,企業(yè)能夠、也必須充分發(fā)揮“可控”的價(jià)值創(chuàng)造能力。

例如,大模型數(shù)據(jù)安全“容錯(cuò)率低”,企業(yè)必須加大投入。

很多基礎(chǔ)設(shè)施廠商都提供了相關(guān)的服務(wù),例如新華三的私域大模型百業(yè)靈犀以內(nèi)置安全限制提示詞和出入內(nèi)容過(guò)濾攔截對(duì)所有場(chǎng)景下大模型生成內(nèi)容進(jìn)行安全性限制,針對(duì)所有出入流量和內(nèi)容進(jìn)行安全審計(jì)和敏感信息攔截。

當(dāng)然,最直觀反應(yīng)大模型倫理、體現(xiàn)“下限”的是場(chǎng)景應(yīng)用的選擇問(wèn)題。

科研、制造、醫(yī)藥、法律……大模型已經(jīng)走向諸多能帶來(lái)社會(huì)正向價(jià)值的場(chǎng)景。但是,諸如偽造視頻進(jìn)行詐騙等“場(chǎng)景應(yīng)用”也已經(jīng)出現(xiàn),基于強(qiáng)力的大模型技術(shù)有著更強(qiáng)的欺騙性。

技術(shù)是刀,大模型是一把更鋒利的刀,它的作用和價(jià)值由使用的人決定。

說(shuō)到底,企業(yè)需要構(gòu)建正確的價(jià)值觀,將大模型能力導(dǎo)向數(shù)字經(jīng)濟(jì)的正向價(jià)值上,才能守住“下限”、實(shí)現(xiàn)大模型的長(zhǎng)期健康發(fā)展。

結(jié)語(yǔ)

大模型賽道上,企業(yè)必須在“可控”的價(jià)值創(chuàng)造空間上發(fā)力,才能不斷在各個(gè)維度獲得更多相對(duì)競(jìng)爭(zhēng)優(yōu)勢(shì)與發(fā)展可能性。

企業(yè)也必須以此為標(biāo)準(zhǔn)選擇基礎(chǔ)設(shè)施服務(wù)、大模型服務(wù)的廠商,尤其是在多個(gè)維度都能滿足需要的廠商。

可以說(shuō),大模型給了這個(gè)時(shí)代全新的增量?jī)r(jià)值方向,只有幫助企業(yè)實(shí)現(xiàn)對(duì)“可控”價(jià)值創(chuàng)造的把握,才能讓企業(yè)在這個(gè)全新方向更有著力點(diǎn)。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-11-03
大模型冷思考:企業(yè)“可控”價(jià)值創(chuàng)造空間還有多少?
大模型冷思考:企業(yè)“可控”價(jià)值創(chuàng)造空間還有多少?

長(zhǎng)按掃碼 閱讀全文