行業(yè)大模型的突圍之戰(zhàn)

大模型的創(chuàng)新,不僅僅需要單點(diǎn)的創(chuàng)新,更要圍繞AI-Native開(kāi)展系統(tǒng)性地創(chuàng)新;不僅要在場(chǎng)景上廣泛探索,更要在技術(shù)上形成突圍。

重塑一切的理想主義AI

大模型已成為當(dāng)下IT產(chǎn)業(yè)無(wú)可爭(zhēng)議的最大風(fēng)口。

人工智能從概念提出至今已有半個(gè)多世紀(jì),繼“深藍(lán)”和AlphaGo曇花一現(xiàn)之后,Transformer架構(gòu)及ChatGPT的橫空出世,再一次點(diǎn)燃全世界的熱情,人工智能以更具象、接地氣的方式呈現(xiàn),大模型和生成式AI也開(kāi)始走入更多人的視野。

過(guò)去的一年來(lái),從互動(dòng)問(wèn)答、語(yǔ)音對(duì)話到文生視頻,OpenAI屢次刷新熱度;Google、Meta入局推出開(kāi)源大模型,圖謀一席之地;微軟將GPT4.0集成到辦公軟件中,成為生產(chǎn)力工具;華為和蘋果將手機(jī)語(yǔ)音助手接入大模型,加速端側(cè)智能化。

AI產(chǎn)業(yè)的拐點(diǎn)已經(jīng)來(lái)到,大模型正在重塑一切辦公、生產(chǎn)和生活。

大模型火熱的背后,英偉達(dá)成為最大的受益方。隨著業(yè)界對(duì)AI算力的需求快速增長(zhǎng),GPU卡洛陽(yáng)紙貴、一卡難求,其24/25Q1季報(bào)同比增長(zhǎng)近4倍,達(dá)到260億美金。受持續(xù)提升的業(yè)績(jī)數(shù)據(jù)和不斷放大的市場(chǎng)需求支撐,2024年6月18日英偉達(dá)市值達(dá)到3.35萬(wàn)億美金,連續(xù)超越微軟、蘋果,成為全球市值最大的公司。

一切都在向著人們期待的方向發(fā)展,甚至有人喊出了“第四次工業(yè)革命已來(lái)”。

盛名之下,其實(shí)難副

這波大模型浪潮并不如表面呈現(xiàn)的那樣光鮮亮麗,幾家歡喜幾家愁。

根據(jù)紅杉資本發(fā)布的報(bào)告,英偉達(dá)僅在2023年的芯片訂單就高達(dá)500億美元,賺得盆滿缽滿,而整個(gè)生成式AI企業(yè)的銷售收入才30億美元,多數(shù)企業(yè)距離盈利依然遙遙無(wú)期,甚至一些企業(yè)已經(jīng)瀕臨破產(chǎn)的邊緣。

如果淘金者持續(xù)淘不到金子,賣鏟子的生意也終將不可持續(xù)。

不管是OpenAI、微軟還是谷歌,這些AI的先行者都還沒(méi)有找到穩(wěn)定且持續(xù)的商業(yè)模式,更多的是為資本描繪了一副宏大的藍(lán)圖,以支撐市場(chǎng)的預(yù)期。

在國(guó)內(nèi),10億參數(shù)規(guī)模以上大模型數(shù)量已遠(yuǎn)超100個(gè)。但還未形成成熟商業(yè)模式的大模型產(chǎn)業(yè),已經(jīng)開(kāi)始卷起了價(jià)格,模型免費(fèi)、Token降價(jià)、算力打折,多么熟悉的味道。在群雄混戰(zhàn)的早期通過(guò)低價(jià)圈定一波用戶和開(kāi)發(fā)者無(wú)可厚非,適當(dāng)?shù)母?jìng)爭(zhēng)有利于產(chǎn)業(yè)的良性發(fā)展,但無(wú)序的競(jìng)爭(zhēng)將導(dǎo)致惡性循環(huán),讓大模型產(chǎn)業(yè)陷入死亡螺旋。

2023年底,Gartner發(fā)布AI新興技術(shù)成熟度曲線,大模型和生成式AI正處在技術(shù)炒作周期的最高點(diǎn),Gartner對(duì)生成式AI做出了極高的評(píng)價(jià),認(rèn)為它將AI的熱度推向了一個(gè)新高潮,但也表達(dá)了對(duì)繁榮之下所掩蓋的潛在風(fēng)險(xiǎn)的擔(dān)憂。

市場(chǎng)最終要回歸理性,只有真正為用戶創(chuàng)造價(jià)值才能實(shí)現(xiàn)商業(yè)閉環(huán)、有更長(zhǎng)遠(yuǎn)未來(lái)。

理想很豐滿,現(xiàn)實(shí)很骨感!大模型從趨勢(shì)到全面落地依然任重道遠(yuǎn)。

化整為零,圍繞行業(yè)穿插作戰(zhàn),實(shí)現(xiàn)戰(zhàn)略突圍

在這一波AI浪潮中,中國(guó)發(fā)展得怎么樣?當(dāng)網(wǎng)絡(luò)上ChatGPT、Sora、英偉達(dá)的新聞鋪天蓋地襲來(lái)時(shí),很多人不免產(chǎn)生焦慮:我們又落后了?

必須承認(rèn),我國(guó)在算力、算法和數(shù)據(jù)領(lǐng)域其實(shí)并不具備優(yōu)勢(shì):高端算力卡被英偉達(dá)卡脖子無(wú)法供應(yīng),短時(shí)間內(nèi)自有制程和設(shè)計(jì)又無(wú)法跟上;算法領(lǐng)域,雖然模型數(shù)量眾多,但大多數(shù)是基于國(guó)外開(kāi)源架構(gòu)優(yōu)化,缺乏自主性和領(lǐng)先性;數(shù)據(jù)領(lǐng)域,我們的開(kāi)放數(shù)據(jù)和國(guó)外不在一個(gè)數(shù)量級(jí)上,中文語(yǔ)料嚴(yán)重不足。

AI的三要素,每一條都是致命傷!

但從另一個(gè)角度看,我國(guó)有全球唯一的全工業(yè)門類、最多的金融消費(fèi)人群以及最大規(guī)模的政務(wù)和城市體系,產(chǎn)生了豐富的場(chǎng)景和私有數(shù)據(jù),這些都成為發(fā)展行業(yè)大模型的天然土壤。于是,我們沒(méi)有走大兵團(tuán)正面突擊的道路,而是化整為零圍繞行業(yè)穿插作戰(zhàn),通過(guò)大模型賦能一個(gè)個(gè)行業(yè)細(xì)分場(chǎng)景,最終形成戰(zhàn)略突圍。

近兩年,在用戶和廠商的共同努力下,一些行業(yè)大模型已經(jīng)開(kāi)花結(jié)果。大模型已經(jīng)逐步應(yīng)用政務(wù)導(dǎo)辦、公文檢索、事件分撥等場(chǎng)景,幫助政府提升政務(wù)服務(wù)效率和城市管理效率;在礦山領(lǐng)域,大模型和云邊協(xié)同幫助礦山實(shí)現(xiàn)增安提效,加速產(chǎn)業(yè)集群智能化;在鐵路,基于視覺(jué)大模型的TFDS火車故障軌邊圖像檢測(cè)系統(tǒng),實(shí)現(xiàn)不停車的實(shí)時(shí)圖像采集和分析,自動(dòng)識(shí)別各種不同類型的鐵路貨車故障;基于大模型的氣象預(yù)測(cè)方案,計(jì)算速度相比傳統(tǒng)HPC的數(shù)值計(jì)算提升一萬(wàn)倍,更精準(zhǔn)預(yù)測(cè)臺(tái)風(fēng)路徑。

還有醫(yī)藥、制造、鋼鐵、金融等更多行業(yè)的場(chǎng)景在持續(xù)落地,我們正在走一條和國(guó)外不一樣的務(wù)實(shí)之路,不跟風(fēng)不冒進(jìn),沿著清晰的目標(biāo)和節(jié)奏逐個(gè)打磨場(chǎng)景,這種涓涓細(xì)流,終將匯聚成智能化的汪洋大海。

行業(yè)大模型加速落地建議

行業(yè)大模型建設(shè),知易行難。

政企業(yè)務(wù)場(chǎng)景復(fù)雜多樣,很難用通用大模型去應(yīng)對(duì)。此時(shí)我們應(yīng)該意識(shí)到,卷參數(shù)量、卷Token數(shù)、卷集群規(guī)模、卷價(jià)格都毫無(wú)意義,行業(yè)大模型落地更需要關(guān)注工程化的問(wèn)題。

一、軟硬協(xié)同發(fā)展

除了模型本身外,大模型還涉及開(kāi)發(fā)平臺(tái)、開(kāi)發(fā)框架、計(jì)算架構(gòu)以及各類工具,以及多樣性算力、高性能存儲(chǔ)和高帶寬網(wǎng)絡(luò)等硬件基礎(chǔ)設(shè)施。在分層解耦架構(gòu)的基礎(chǔ)上,需要從性能、可靠性、可維護(hù)性以及兼容性等方面,進(jìn)行端到端的集成設(shè)計(jì)和驗(yàn)證。比如軟硬件全鏈路可視化運(yùn)維、算網(wǎng)協(xié)同的低時(shí)延大帶寬網(wǎng)絡(luò)、基于親和性的算子加速等,確保系統(tǒng)不僅跑得好,更要跑得穩(wěn)。

二、采用AI-Native的云基礎(chǔ)設(shè)施

AI-Native的云基礎(chǔ)設(shè)施正成為越來(lái)越多企業(yè)的優(yōu)先選擇?;诠性朴?xùn)練基礎(chǔ)大模型,在本地私有云中結(jié)合私有數(shù)據(jù)通過(guò)二次訓(xùn)練和微調(diào),這種混合云方案兼顧效率與安全,已成為大模型建設(shè)的新范式,同時(shí)云邊協(xié)同的架構(gòu)還可以有效簡(jiǎn)化海量邊緣的管理,應(yīng)對(duì)工業(yè)場(chǎng)景海量邊緣接入的需求。它相比非云的部署模式,還能提供對(duì)通用算力和AI算力的統(tǒng)一調(diào)度,并基于其豐富技術(shù)棧覆蓋數(shù)據(jù)、模型和應(yīng)用開(kāi)發(fā)全流程,降低開(kāi)發(fā)門檻。

三、建立AI開(kāi)發(fā)工作流,促進(jìn)模型確定性交付

大模型是一個(gè)系統(tǒng)工程,其交付過(guò)程涉及數(shù)據(jù)管理、模型開(kāi)發(fā)環(huán)境、模型訓(xùn)練、推理部署的全流程數(shù)十個(gè)環(huán)節(jié),傳統(tǒng)的開(kāi)發(fā)機(jī)制很難解決跨團(tuán)隊(duì)協(xié)作和迭代開(kāi)發(fā)的難題。要降低模型開(kāi)發(fā)過(guò)程的不確定性,需要建立一站式AI開(kāi)發(fā)工作流,幫助企業(yè)快速構(gòu)建跨團(tuán)隊(duì)協(xié)同開(kāi)發(fā)、高效迭代的機(jī)制,同時(shí)通過(guò)標(biāo)準(zhǔn)化、自動(dòng)化的流程提高模型的交付效率與交付質(zhì)量。

四、重視數(shù)據(jù)工程,打造優(yōu)質(zhì)數(shù)據(jù)集

模型性能是由數(shù)據(jù)質(zhì)量和算法設(shè)計(jì)共同決定的,當(dāng)前AI訓(xùn)練數(shù)據(jù)缺乏系統(tǒng)化的治理工具,甚至部分工作需要人為處理,存在集成、清洗和標(biāo)注效率低,以及價(jià)值觀的問(wèn)題。打造高質(zhì)量的AI大模型,必須構(gòu)筑核心的數(shù)據(jù)工程能力,為大模型高質(zhì)量供數(shù)。一方面可以借助開(kāi)放的數(shù)據(jù)授權(quán)運(yùn)營(yíng)平臺(tái),獲取高質(zhì)量的數(shù)據(jù);另一方面,針對(duì)內(nèi)部數(shù)據(jù)需要引入自動(dòng)化和智能化的手段,構(gòu)建數(shù)據(jù)清洗、標(biāo)注和質(zhì)量評(píng)估體系;同時(shí)通過(guò)數(shù)據(jù)質(zhì)量分析、成分分析、場(chǎng)景配比和智能配比能力,建立數(shù)據(jù)配比到模型效果的反饋優(yōu)化機(jī)制,基于應(yīng)用效果反饋持續(xù)調(diào)優(yōu),實(shí)現(xiàn)價(jià)值觀對(duì)齊。

五、建立賦能機(jī)制,繁榮產(chǎn)業(yè)生態(tài)

生態(tài)是發(fā)展大模型不可或缺的一環(huán)。需要從技術(shù)生態(tài)、數(shù)據(jù)生態(tài)、模型生態(tài)和應(yīng)用生態(tài)四個(gè)層面,去構(gòu)建AI時(shí)代開(kāi)放、可閉環(huán)、有質(zhì)量的生態(tài)體系。這個(gè)過(guò)程中,政府和行業(yè)頭部企業(yè)的作用不可忽視,可以帶頭建立如聯(lián)創(chuàng)實(shí)驗(yàn)室、模型和應(yīng)用商城、需求對(duì)接會(huì)、創(chuàng)新大賽等,并通過(guò)資金贊助、人才培養(yǎng)、政策扶持等多方面的牽引,通過(guò)行政手段打造中立的區(qū)域性賦能平臺(tái);行業(yè)頭部企業(yè)在開(kāi)展自身業(yè)務(wù)創(chuàng)新的同時(shí),也可以通過(guò)技術(shù)、數(shù)據(jù)、模型和應(yīng)用賦能行業(yè)和產(chǎn)業(yè)鏈上下游,從單企智能化走向行業(yè)智能化。

六、開(kāi)展持續(xù)運(yùn)營(yíng)

大模型落地面臨缺經(jīng)驗(yàn)、缺人才、缺能力的挑戰(zhàn),大多數(shù)企業(yè)都是邊實(shí)踐、邊總結(jié)。需要將這些經(jīng)驗(yàn)和能力固化下來(lái),逐步形成覆蓋了大模型落地的全流程的工程能力,包括前期的頂層設(shè)計(jì)、POC測(cè)試、規(guī)劃實(shí)施,中期構(gòu)建優(yōu)質(zhì)數(shù)據(jù)集、開(kāi)展場(chǎng)景分析和模型開(kāi)發(fā),以及后期的運(yùn)維運(yùn)營(yíng)等。大模型運(yùn)營(yíng)和建設(shè)同樣重要,缺少運(yùn)營(yíng)機(jī)制,大模型平臺(tái)很難持續(xù)發(fā)揮價(jià)值。因此,需要打造適合企業(yè)的流程、組織和人才隊(duì)伍,持續(xù)開(kāi)展技術(shù)、生態(tài)、用戶運(yùn)營(yíng),不會(huì)斷優(yōu)化老場(chǎng)景、發(fā)掘新場(chǎng)景,最終實(shí)現(xiàn)全面智能化。

欲木之長(zhǎng)者,必固其根本

大模型創(chuàng)新,歸根結(jié)底是技術(shù)之爭(zhēng),根深才能葉茂。

大模型的創(chuàng)新,不僅僅需要單點(diǎn)的創(chuàng)新,更要圍繞AI-Native開(kāi)展系統(tǒng)性地創(chuàng)新,不僅要在場(chǎng)景上廣泛探索,更要在技術(shù)上形成突圍。

近年來(lái),國(guó)內(nèi)涌現(xiàn)了一批代表性的科技企業(yè),如寒武紀(jì)、地平線、壁仞科技、訊飛、摩爾線程、華為、阿里、百度等,他們堅(jiān)持投入人工智能創(chuàng)新,推動(dòng)AI產(chǎn)業(yè)升級(jí)。

2023年,百度 “文心一言”、阿里 “通義千問(wèn)”和訊飛 “星火”陸續(xù)推出,華為也發(fā)布盤古大模型3.0,提出“AI for industries”的理念,并基于華為云Stack推出了業(yè)界首個(gè)大模型混合云。近期HDC2024上,華為云盤古大模型5.0升級(jí)亮相,打造全系列、多模態(tài)和強(qiáng)思維能力,進(jìn)一步詮釋“解難題、做難事”的愿景,同時(shí)發(fā)布大模型混合云十大創(chuàng)新技術(shù),通過(guò)AI-Native的系統(tǒng)性創(chuàng)新,加速企業(yè)專屬大模型落地。

創(chuàng)新者往往孤獨(dú),但注定不凡。

不僅需要沉下心,更要有“板凳要坐十年冷”的戰(zhàn)略耐性。

我們終將迎來(lái)AI的黃金時(shí)代。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-06-24
行業(yè)大模型的突圍之戰(zhàn)
大模型的創(chuàng)新,不僅僅需要單點(diǎn)的創(chuàng)新,更要圍繞AI-Native開(kāi)展系統(tǒng)性地創(chuàng)新;不僅要在場(chǎng)景上廣泛探索,更要在技術(shù)上形成突圍。重塑一切的理...

長(zhǎng)按掃碼 閱讀全文