2023年接近尾聲,AI大模型的熱度絲毫不減。
谷歌剛宣布為開(kāi)發(fā)人員提供新版Gemini大模型并承諾降低使用成本,微軟就推出了擁有27億參數(shù)的全新語(yǔ)言模型Phi-2。在頭部巨頭動(dòng)作頻頻時(shí),腰部玩家開(kāi)始抱團(tuán),比如百奧幾何與智譜AI開(kāi)始共建自然語(yǔ)言-生命語(yǔ)言多模態(tài)大模型。
雖然百度等巨頭早在2019年前后就已布局大模型技術(shù),但2023年確實(shí)算得上是“大模型元年”,幾乎所有頭部科技大廠都深度參與研發(fā),熱錢不斷涌入,將“千模大戰(zhàn)”推向新的高潮。然而,在大模型“軍備競(jìng)賽”之余,業(yè)內(nèi)出現(xiàn)了越來(lái)越多的冷思考:基礎(chǔ)大模型越來(lái)越多,能實(shí)現(xiàn)產(chǎn)業(yè)化落地為何寥寥無(wú)幾?2024年,AI技術(shù)產(chǎn)品化、產(chǎn)業(yè)化以及商業(yè)化,將是大模型發(fā)展的重中之重。
(圖片來(lái)自UNsplash)
“千模大戰(zhàn)”高潮迭起,產(chǎn)業(yè)化成頭號(hào)難題
從參與企業(yè)規(guī)模、大模型數(shù)量與市場(chǎng)規(guī)模來(lái)看,中國(guó)已是僅次于美國(guó)的全球第二大大模型產(chǎn)業(yè)中心。
作為國(guó)產(chǎn)大模型的“扛旗者”,李彥宏在上個(gè)月的西麗湖論壇上提及一組數(shù)據(jù):截止今年10月國(guó)內(nèi)發(fā)布的大模型多達(dá)238個(gè),較6月翻了整整三倍,Hugging Face平臺(tái)上可供下載的文本生成大模型則接近3萬(wàn)個(gè)。按比例劃分,美、中兩國(guó)已上線/在研大模型數(shù)量占到全球的80%以上,吊打其他國(guó)家或地區(qū)。
據(jù)速途網(wǎng)測(cè)算,2023年中國(guó)大模型市場(chǎng)規(guī)模約為147億元,同比翻了一倍,預(yù)計(jì)在2028年將突破千億大關(guān)。龐大的市場(chǎng)規(guī)模,巨頭的高度重視,誘惑著資本不斷加大投入;AI對(duì)提升生產(chǎn)效率與經(jīng)濟(jì)質(zhì)量有著重要意義,一定程度關(guān)系到國(guó)家核心競(jìng)爭(zhēng)力,因此也得到了有關(guān)部門高度重視。可以說(shuō),大模型狂飆一整年,離不開(kāi)政策的支持、巨頭的重視和資本的熱情。
在大模型技術(shù)有序發(fā)展上我國(guó)走在世界前列,網(wǎng)信辦等七部委聯(lián)合發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》、北京科委發(fā)布的《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025)(征求意見(jiàn)稿)》等中央和地方政府扶持措施相繼出爐,為大模型的發(fā)展掃清障礙,既提供必要資源傾斜,也避免技術(shù)無(wú)序發(fā)展。
資本方面,百度、阿里、騰訊、字節(jié)、科大訊飛、美團(tuán)、京東、網(wǎng)易等大廠均在布局大模型技術(shù),有實(shí)力的初創(chuàng)企業(yè)則成了VC們爭(zhēng)搶的香饃饃,熱錢不斷涌入。中國(guó)新一代人工智能發(fā)展戰(zhàn)略研究院的報(bào)告顯示,截止10月底,國(guó)內(nèi)已有38起大模型投融資事件,現(xiàn)存AI企業(yè)已超過(guò)2200家。
(圖片來(lái)自貝殼財(cái)經(jīng))
而在技術(shù)層面,文心大模型、阿里通義、訊飛星火、智譜等國(guó)產(chǎn)基礎(chǔ)大模型在多個(gè)榜單上的評(píng)測(cè)均位居前列,一定程度上已能與GPT PK。
大模型行業(yè)欣欣向榮,但依然存在一些隱憂——比如困擾大部分從業(yè)者的產(chǎn)業(yè)化落地問(wèn)題。任何前沿技術(shù)都要轉(zhuǎn)化為產(chǎn)品或者說(shuō)應(yīng)用才能為人所用,才能發(fā)揮價(jià)值。AI大模型當(dāng)前在基礎(chǔ)技術(shù)迎頭直追的同時(shí),更需要深入到產(chǎn)業(yè)端的場(chǎng)景中,在企業(yè)的生產(chǎn)經(jīng)營(yíng)中,或者用戶的生活學(xué)習(xí)中發(fā)揮作用。事實(shí)上,后者正是中國(guó)AI產(chǎn)業(yè)一直以來(lái)的優(yōu)勢(shì):相較于下棋、畫畫、作詩(shī)而言,中國(guó)科技從業(yè)者更接地氣,善于將技術(shù)應(yīng)用到場(chǎng)景中,讓其為產(chǎn)品、應(yīng)用或者服務(wù)所用——哪怕沒(méi)那么炫酷也不重要。
三個(gè)標(biāo)桿案例,看大模型產(chǎn)業(yè)化落地之路
大模型產(chǎn)業(yè)化的難點(diǎn)很多,比如不同行業(yè)數(shù)字化程度參差不齊,不同規(guī)模、不同領(lǐng)域的企業(yè)對(duì)AI的應(yīng)用需求、可承擔(dān)的成本,有顯著差別,這里的成本除了資金等經(jīng)濟(jì)成本外,還有應(yīng)用AI技術(shù)改造業(yè)務(wù)的風(fēng)險(xiǎn)、時(shí)間與邊際成本。正因?yàn)榇耍?dāng)前雖然很多企業(yè)都在關(guān)注大模型技術(shù),但真正做到用大模型技術(shù)來(lái)改造業(yè)務(wù)甚至打造AI原生應(yīng)用的企業(yè),卻少之又少。
不過(guò)浪里淘沙,我們也能看到一些大模型技術(shù)和產(chǎn)業(yè)結(jié)合的標(biāo)桿案例。
1、度小滿軒轅大模型:國(guó)內(nèi)首個(gè)開(kāi)源金融大模型
數(shù)據(jù)驅(qū)動(dòng)的金融業(yè)是數(shù)字化程度較高的產(chǎn)業(yè),數(shù)據(jù)庫(kù)、存儲(chǔ)、服務(wù)器、自動(dòng)化、信息安全等等數(shù)字化基礎(chǔ)設(shè)施,均是在金融業(yè)率先應(yīng)用普及。在AI技術(shù)普及過(guò)程中,金融業(yè)很早就在積極探索將AI與客服、風(fēng)控、授信、營(yíng)銷等場(chǎng)景結(jié)合,降本增效的同時(shí),提升客戶體驗(yàn)。
2023年,大模型技術(shù)爆發(fā)。金融科技先鋒平臺(tái)度小滿在5月就率先開(kāi)源了國(guó)內(nèi)首個(gè)千億級(jí)中文金融大模型“軒轅”;9月,“軒轅70B”開(kāi)源開(kāi)放可被自由下載和使用。作為金融場(chǎng)景而生的行業(yè)大模型,軒轅在智能化能力、功能服務(wù)以及信息安全上均有很強(qiáng)的針對(duì)性。
這種針對(duì)性體現(xiàn)在多個(gè)方面:比如軒轅用來(lái)訓(xùn)練的數(shù)據(jù)集包含大量機(jī)構(gòu)研報(bào)、專業(yè)名詞、行情數(shù)據(jù)等金融行業(yè)資料,賦予了其極強(qiáng)的金融信息理解和處理能力。
在技術(shù)實(shí)力上,軒轅大模型不遑多讓。其已通過(guò)注冊(cè)會(huì)計(jì)師考試、銀行/證券/保險(xiǎn)/基金/期貨從業(yè)資格、理財(cái)規(guī)劃師、經(jīng)濟(jì)師等金融領(lǐng)域權(quán)威考試。而在清華大學(xué)、上海交大和愛(ài)丁堡大學(xué)聯(lián)合發(fā)布的C-Eval大語(yǔ)言模型測(cè)評(píng)榜單和微軟亞洲研究院、MBZUAI、上海交大聯(lián)合推出的CMMLU榜單中,軒轅均取得了國(guó)內(nèi)所有開(kāi)源模型排名第一的成績(jī)。C-Eval和CMMLU是目前較為權(quán)威的兩大專業(yè)榜單,能夠同時(shí)奪得第一,對(duì)軒轅這樣的行業(yè)大模型來(lái)說(shuō)絕對(duì)算得上好成績(jī)了。
度小滿軒轅大模型正在金融場(chǎng)景深入應(yīng)用。
在內(nèi)部,軒轅大模型已深入賦能度小滿營(yíng)銷、客服、風(fēng)控、辦公再到研發(fā)等場(chǎng)景,并已初見(jiàn)成效。在代碼助手方面,用大模型輔助生成的代碼,采納率能夠達(dá)到42%,幫助公司整體研發(fā)效率提升了20%;在客服領(lǐng)域,大模型推動(dòng)服務(wù)效率提升了25%。在智能辦公領(lǐng)域,大模型目前的意圖識(shí)別準(zhǔn)確率已達(dá)到97%。
度小滿向來(lái)都很重視金融科技能力對(duì)外輸出。度小滿CTO許冬亮透露,軒轅在5月開(kāi)源時(shí)就有上百家金融機(jī)構(gòu)發(fā)出試用申請(qǐng)。從企業(yè)客戶的反饋來(lái)看,軒轅大模型的專業(yè)能力有口皆碑,2.0版本上下文對(duì)話長(zhǎng)度增加至8K,對(duì)“非利息收入增長(zhǎng)趨勢(shì)”等金融業(yè)的深度問(wèn)題也能給出專業(yè)解釋。
2、阿里通義千問(wèn)大模型,在電商行業(yè)貫徹“AI驅(qū)動(dòng)”戰(zhàn)略。
2023年阿里巴巴有許多大的變動(dòng),“用戶為先、AI驅(qū)動(dòng)”成為新的戰(zhàn)略方向。4月11日發(fā)布通義千問(wèn)大模型的時(shí)候,時(shí)任阿里巴巴集團(tuán)董事長(zhǎng)、阿里云智能集團(tuán)CEO張勇就表示“所有軟件都值得用大模型升級(jí)改造,阿里所有產(chǎn)品都會(huì)接入通義千問(wèn)。”
阿里確實(shí)說(shuō)到做到,作為阿里大本營(yíng)的電商業(yè)務(wù)就早已全面AI化。以通義千問(wèn)大模型為基礎(chǔ),淘天集團(tuán)推出了一系列面向B、C兩端的AI工具。
面向B端的工具包括官方客服機(jī)器人、圖片智能生成、營(yíng)銷投放自主監(jiān)測(cè)等,今年雙11大促期間商家調(diào)用后臺(tái)AI工具的次數(shù)超過(guò)15億次;面向C端則推出AI智能助手淘寶問(wèn)問(wèn),上線兩個(gè)月受邀試用人數(shù)突破500萬(wàn)。B端工具可提高商家經(jīng)營(yíng)效率、降低流量成本,C端功能則可顯著改善用戶體驗(yàn),在電商行業(yè)狂卷價(jià)格時(shí)形成差異化競(jìng)爭(zhēng)力。
大模型與電商場(chǎng)景的結(jié)合,阿里走得最快也最遠(yuǎn),馬云在阿里內(nèi)網(wǎng)回帖中甚至提到了“AI電商”這一讓人耳目一新的概念。
為了進(jìn)一步強(qiáng)化大模型技術(shù)實(shí)力,以及深化AI與業(yè)務(wù)的融合,近日淘天集團(tuán)被爆暗中組建新的AI團(tuán)隊(duì),高調(diào)高薪招聘AI頂尖人才,抓緊時(shí)間訓(xùn)練針對(duì)電商產(chǎn)業(yè)的專屬大模型“圖靈”。根據(jù)淘天集團(tuán)此前透露的消息,未來(lái)一年會(huì)向商家發(fā)布更多AI工具,包括AI開(kāi)店、經(jīng)營(yíng)咨詢、智能周報(bào)等,服務(wù)范圍涉及商家日常經(jīng)營(yíng)的方方面面。在阿里的推動(dòng)下,大模型和電商產(chǎn)業(yè)的結(jié)合才剛剛開(kāi)始??梢灶A(yù)見(jiàn),2024年,頭部電商平臺(tái)均會(huì)加碼“大模型電商”。
3、科大訊飛星火大模型:大模型+教育的標(biāo)桿玩家。
科大訊飛的第一標(biāo)簽是語(yǔ)音智能,第二標(biāo)簽就是智能教育科技巨頭。在大模型技術(shù)出現(xiàn)前,科大訊飛在AI技術(shù)上就已耕耘多年,其相當(dāng)一部分營(yíng)收就來(lái)自智能教育服務(wù),如口語(yǔ)評(píng)測(cè)、教育硬件等教育智能化服務(wù)。
在大模型技術(shù)爆發(fā)后,星火大模型和教育行業(yè)的結(jié)合更是轟轟烈烈。今年5月訊飛星火認(rèn)知大模型1.0版本發(fā)布次日,帶飛了A股教育科技板塊,除了科大訊飛外,學(xué)大教育、行動(dòng)教育、國(guó)新文化全跟著漲停,呈現(xiàn)出“星火燎原”之勢(shì)。
從1.0到3.0,訊飛星火大模型一直重點(diǎn)攻克代碼能力和多模態(tài)能力,并基于技術(shù)上的突破開(kāi)發(fā)出更多針對(duì)學(xué)校、教育企業(yè)以及教師和學(xué)生群體的功能、應(yīng)用。比如針對(duì)學(xué)校管理環(huán)節(jié)的學(xué)生及教師信息管理、離校申請(qǐng)審核功能,為教師量身打造的教學(xué)課件制作助手,給學(xué)生提供的AI一對(duì)一啟發(fā)式對(duì)話功能等。與此同時(shí),訊飛在其翻譯筆、錄音筆、學(xué)習(xí)機(jī)、辦公本等教育硬件上也在深入應(yīng)用大模型技術(shù),強(qiáng)化產(chǎn)品力,鞏固在這一品類上的優(yōu)勢(shì)。
(圖片來(lái)自訊飛星火官網(wǎng))
金融、電商與教育,三個(gè)行業(yè)的頭部玩家,均能在大模型的改造下獲得全新增長(zhǎng)點(diǎn),可見(jiàn)大模型產(chǎn)業(yè)化并非癡人說(shuō)夢(mèng),而是必然趨勢(shì)。
大模型開(kāi)卷2024:有無(wú)產(chǎn)業(yè)化秘訣?
度小滿、阿里、科大訊飛們只是開(kāi)了個(gè)好頭,大模型產(chǎn)業(yè)化程度依然有很大提升空間,特別是歷史悠久、數(shù)字化程度較低的農(nóng)業(yè)、制造業(yè)、物流航運(yùn)業(yè)、能源業(yè)等產(chǎn)業(yè),更是亟需擁抱大模型技術(shù)提高生產(chǎn)效率,實(shí)現(xiàn)從數(shù)字化到智能化的跨越。鑒于此,加速AI技術(shù)產(chǎn)品化、產(chǎn)業(yè)化和商業(yè)化將是大模型行業(yè)在2024年的頭號(hào)任務(wù)。誰(shuí)能率先跑通產(chǎn)業(yè)化落地路徑,誰(shuí)就可以在“千模大戰(zhàn)”中笑到最后。那么,標(biāo)桿玩家們給大模型產(chǎn)業(yè)化帶來(lái)了什么啟示呢?
第一,不重復(fù)發(fā)明輪子,有針對(duì)性地選擇訓(xùn)練參數(shù)和設(shè)計(jì)功能服務(wù)。
基礎(chǔ)大模型已經(jīng)很多了,市面上缺的是能跟抗衡甚至超越GPT的頂尖基礎(chǔ)大模型,以及可讓千行百業(yè)更低成本、更低門檻、更快應(yīng)用的“產(chǎn)業(yè)大模型”。而要做出強(qiáng)大的產(chǎn)業(yè)大模型,需要“既懂AI技術(shù)又是產(chǎn)業(yè)專家”。
度小滿就是一個(gè)很好的例子,一邊有背靠百度的AI技術(shù)底子,另一邊有深耕金融科技行業(yè)多年積攢下的產(chǎn)業(yè)認(rèn)知、能力、場(chǎng)景、生態(tài)等資源。
據(jù)悉,軒轅雖是基于擁有1760億參數(shù)的Bloom大模型訓(xùn)練而成,但也離不開(kāi)度小滿這些年積累的千億tokens中文預(yù)訓(xùn)練數(shù)據(jù)集,包括銀行、保險(xiǎn)、基金等行業(yè)的基礎(chǔ)知識(shí)與巨量參數(shù)。因?yàn)橛泻笳撸庌@大模型才有遠(yuǎn)超同類競(jìng)品和通用大模型的金融信息處理能力,也才可以面向金融業(yè)的痛點(diǎn)場(chǎng)景提供針對(duì)性的功能服務(wù)。
第二,深入貼合行業(yè)需求“定制”大模型功能服務(wù),而不是閉門造車。
技術(shù)類公司容易出現(xiàn)“拿著錘子找釘子”的問(wèn)題,如果不能貼合真實(shí)需求,技術(shù)再?gòu)?qiáng)大都可能只是自嗨。
為什么度小滿、阿里和科大訊飛可以在大模型產(chǎn)業(yè)化上先嘗到甜頭?因?yàn)榘⒗锉旧砭褪请娚坍a(chǎn)業(yè)的龍頭,度小滿從成立之日起一直深度參與國(guó)內(nèi)科技金融行業(yè)建設(shè),科大訊飛也深耕智能教育行業(yè)十?dāng)?shù)載,它們對(duì)相應(yīng)行業(yè)理解非一般企業(yè)所能及。讀懂行業(yè)運(yùn)作邏輯和深層次問(wèn)題,就能洞悉企業(yè)、從業(yè)者的真正痛點(diǎn),并給出行之有效的解決方案。
以度小滿為例,基于的理解、生成、邏輯和記憶四個(gè)基礎(chǔ)能力,軒轅大模型融合金融行業(yè)的使用習(xí)慣、優(yōu)化需求,提供了一系列針對(duì)性功能。比如個(gè)人信貸管理服務(wù),軒轅大模型為銀行客戶提供客戶歷史信息管理、用戶多層次需求分析功能,給用戶提供專業(yè)問(wèn)題自然語(yǔ)言交互問(wèn)答服務(wù),充分提高雙方的處理效率。度小滿在服務(wù)金融機(jī)構(gòu)和自有客戶時(shí)洞察了許多需求,才可以做出真正能用、有用、好用的金融大模型產(chǎn)品。
第三,眾人抬柴火焰高,大模型不是獨(dú)角戲,必須惠及行業(yè)參與者。
中小企業(yè)是產(chǎn)業(yè)鏈的主力軍,然而因?yàn)槭芟抻谫Y金實(shí)力與人才資源,往往很難再第一時(shí)間應(yīng)用新技術(shù),特別是門檻很高的新技術(shù)。相較于深度學(xué)習(xí)而言,大模型需要巨量算力、巨量數(shù)據(jù)和巨量算法,門檻高出了許多,對(duì)很多企業(yè)來(lái)說(shuō)有些可望不可即。這對(duì)頭部玩家來(lái)說(shuō)是機(jī)遇所在,如果堅(jiān)持普惠開(kāi)放路線,既可讓大模型技術(shù)有“產(chǎn)業(yè)化”的落點(diǎn),也可以在大模型產(chǎn)業(yè)化中獲取對(duì)應(yīng)價(jià)值。
在度小滿和北大光華管理學(xué)院聯(lián)合舉辦的大模型技術(shù)與應(yīng)用論壇上,度小滿CTO許冬亮就發(fā)表過(guò)類似觀點(diǎn),他認(rèn)為大模型是中小金融機(jī)構(gòu)突圍而出的機(jī)會(huì),因?yàn)樗鼈兛赏ㄟ^(guò)應(yīng)用創(chuàng)新加快數(shù)字化、智能化升級(jí)進(jìn)程,繼而跨越數(shù)字化鴻溝。
也不難發(fā)現(xiàn),“開(kāi)放”成了成功落地產(chǎn)業(yè)的大模型的最大公約數(shù)。度小滿的軒轅、阿里的通義千問(wèn)、科大訊飛的星火走的均是開(kāi)源開(kāi)放路線。正如許冬亮所言,將大模型能力開(kāi)放給金融機(jī)構(gòu),不僅可以加快技術(shù)的推廣普及,還能降低使用門檻,是實(shí)現(xiàn)技術(shù)普惠的必然選擇。
跟區(qū)塊鏈等新興技術(shù)的曇花一現(xiàn)不同,大模型的熱度不會(huì)驟然下降。一方面,大模型技術(shù)在2024年將會(huì)縱深到更多產(chǎn)業(yè),C端,大模型驅(qū)動(dòng)的爆款現(xiàn)象級(jí)應(yīng)用一定會(huì)出現(xiàn),B端,大模型產(chǎn)業(yè)化的案例只會(huì)越來(lái)越多。另一方面,大模型技術(shù)本質(zhì)是深度學(xué)習(xí)技術(shù)的延續(xù)。AI技術(shù)已發(fā)展10余年,未來(lái)幾十年都將是科技產(chǎn)業(yè)的基礎(chǔ)技術(shù)。大模型是AI浪潮上最大的一朵浪花,而AI浪潮,將持續(xù)澎湃。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美國(guó)無(wú)人機(jī)禁令升級(jí)?當(dāng)?shù)乜茖W(xué)家率先“喊疼”:我們離不開(kāi)大疆
- iQOO Neo10 Pro:性能特長(zhǎng)之外,亦有全能實(shí)力
- 自動(dòng)駕駛第一股的轉(zhuǎn)型迷途:圖森未來(lái)賭上了AIGC
- 明星熱劇、品牌種草、平臺(tái)資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機(jī)看它就夠了!
- 游戲體驗(yàn)天花板,一加 Ace 5 系列售價(jià) 2299 元起
- 16個(gè)月沒(méi)工資不敢離職,這些打工人“自費(fèi)上班”
- 怎樣利用微信小店“送禮”功能賺錢?
- 鴻蒙智行問(wèn)界M9,中國(guó)豪華車的龍門一躍
- 科技云報(bào)道:人工智能時(shí)代“三大件”:生成式AI、數(shù)據(jù)、云服務(wù)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。