科技云報(bào)道原創(chuàng)。
一覺醒來,萬眾期待的GPT-4來了。OpenAI老板Sam Altman直接開門見山地介紹說:“這是我們迄今為止功能最強(qiáng)大的模型!”僅隔一天,“中國版ChatGPT”百度文心一言正式發(fā)布,雙方大有擺擂之勢。
當(dāng)深度學(xué)習(xí)推動(dòng)AI技術(shù)又一次復(fù)興,人類對它的最高期待,就是讓AI成為第四次產(chǎn)業(yè)革命中的“蒸汽機(jī)”。
而近幾年身處智能革命前沿的,就是預(yù)訓(xùn)練大模型。
ChatGPT的橫空出世,不僅在科技圈引起嘩然,更是點(diǎn)燃了創(chuàng)投圈的創(chuàng)業(yè)激情。
國內(nèi)企業(yè)的大規(guī)模預(yù)訓(xùn)練模型(以下簡稱“大模型”)賽道也已經(jīng)開始進(jìn)入白熱化的競爭階段。
在過去的兩周內(nèi),諸多以AI大模型為技術(shù)底層的廠商,開始獲得資本的青睞。
那么,AI大模型目前的主要技術(shù)路徑是怎樣的?在產(chǎn)業(yè)側(cè)的成長如何?
“通用大模型+產(chǎn)業(yè)模型”的技術(shù)路徑
必須正視的是,全球大模型競賽中,我們看到大模型的參數(shù)越來越大,數(shù)據(jù)集記錄不斷被刷新。
“在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上和人類相當(dāng)?!睂τ趧倓偘l(fā)布的GPT-4,OpenAI對于其表現(xiàn)相當(dāng)滿意。
OpenAI在官網(wǎng)表示,GPT-4是一個(gè)能接受圖像和文本輸入,并輸出文本的多模態(tài)模型,是OpenAI在擴(kuò)展深度學(xué)習(xí)方面的最新里程碑。
從性能表現(xiàn)看,GPT-4的語言理解和生成能力均超過了ChatGPT,可以解答ChatGPT無法完成的問題,同時(shí)GPT-4可以描述并理解圖片,并且可接受的文字輸入長度也增加到約2.4萬個(gè)單詞。
升級(jí)之后,GPT-4在各種職業(yè)和學(xué)術(shù)考試上表現(xiàn)和人類水平相當(dāng)。
比如模擬律師考試,GPT-4取得了前10%的好成績,相比之下GPT-3.5是倒數(shù)10%。
做美國高考SAT試題,GPT-4也在閱讀寫作中拿下710分高分、數(shù)學(xué)700分(滿分800)。
但真正的產(chǎn)業(yè)空間里,卻很難看到大模型規(guī)?;?、標(biāo)準(zhǔn)化應(yīng)用。
這可能是因?yàn)榇竽P团c行業(yè)知識(shí)不相匹配,行業(yè)算力基礎(chǔ)難以負(fù)載大模型部署等等問題。
過去多年的一個(gè)市場共識(shí)是,如果要實(shí)現(xiàn)AI規(guī)模化產(chǎn)業(yè)落地,底層AI大模型就必須是一個(gè)通用的大模型平臺(tái),廠商根據(jù)用戶需求在平臺(tái)之上,進(jìn)行多場景、多領(lǐng)域的模型生產(chǎn),從而實(shí)現(xiàn)具體行業(yè)模型的落地。
對于廠商而言,這也是一個(gè)新的方向。即AI廠商以“通用模型+產(chǎn)業(yè)模型”不斷賦能企業(yè)、產(chǎn)業(yè),從而加速中國的產(chǎn)業(yè)數(shù)字化進(jìn)程。
更為重要的是,這種模式一旦落地成功或?qū)⒖焖賹?shí)現(xiàn)規(guī)?;?yīng),或?qū)轭^部AI廠商帶來高回報(bào),擺脫當(dāng)下AI技術(shù)落地難,盈利難的現(xiàn)狀。
底層AI大模型的研發(fā)具有數(shù)據(jù)規(guī)模大、質(zhì)量參差不齊、模型體積大、訓(xùn)練難度高、算力規(guī)模大、性能要求高等挑戰(zhàn)。
這樣的高研發(fā)門檻,不利于人工智能技術(shù)在千行百業(yè)的推廣。
而具有數(shù)據(jù)、算力、算法綜合優(yōu)勢的企業(yè)可以將模型的復(fù)雜生產(chǎn)過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺(tái),向千行百業(yè)提供大模型服務(wù)。
各個(gè)行業(yè)的企業(yè)只需要通過生產(chǎn)平臺(tái)提出在實(shí)際AI應(yīng)用中的具體需求,生產(chǎn)大模型的少數(shù)企業(yè)就能夠根據(jù)應(yīng)用場景進(jìn)一步對大模型開發(fā)訓(xùn)練,幫助應(yīng)用方實(shí)現(xiàn)大模型的精調(diào),以達(dá)到各行業(yè)對于AI模型的直接應(yīng)用。
彼時(shí),AI大模型就會(huì)真正意義上實(shí)現(xiàn)產(chǎn)業(yè)化,成為產(chǎn)業(yè)模型。
目前,國內(nèi)布局AI大模型廠商百度、阿里、騰訊、商湯、華為等企業(yè),正在不斷夯實(shí)通用大模型,打造產(chǎn)業(yè)模型,助力AI大模型產(chǎn)業(yè)化。
其中,百度以文心大模型+飛槳PaddlePaddle深度學(xué)習(xí)平臺(tái);騰訊以HunYuan大模型+太極機(jī)器學(xué)習(xí)平臺(tái);阿里以通義大模型+M6-OFA;華為以盤古大模型+ModelArts,都打造了自然語言處理大模型、計(jì)算機(jī)視覺大模型以及多模態(tài)大模型方面。
值得注意的是,各個(gè)廠商AI大模型的布局,有所差異。
百度由于多年在AI領(lǐng)域的深耕,其文心大模型涵蓋基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級(jí)體系,打造大模型總量約40個(gè),產(chǎn)業(yè)應(yīng)用也較為廣泛,例如電力、燃?xì)狻⒔鹑?、航天等,?gòu)建了國內(nèi)業(yè)界較大的產(chǎn)業(yè)大模型。
目前來看,屬于國內(nèi)大模型廠商的第一梯隊(duì)中的佼佼者。
騰訊產(chǎn)業(yè)化應(yīng)用方向則主要是騰訊自身生態(tài)的降本增效,其中廣告類應(yīng)用表現(xiàn)出色。
阿里更重技術(shù),例如M6大模型基于阿里云、達(dá)摩院打造的硬件優(yōu)勢,可將大模型所需算力壓縮到極致;另外其底層技術(shù)優(yōu)勢還有利于構(gòu)建AI的統(tǒng)一底層。
目前,主要應(yīng)用方向是為下游任務(wù)提質(zhì)增效,例如在淘寶服飾類搜索場景中實(shí)現(xiàn)了以文搜圖的跨模態(tài)搜索。
華為的優(yōu)勢則在于其訓(xùn)練出業(yè)界首個(gè)2000億參數(shù)以中文為核心的預(yù)訓(xùn)練生成語言模型。
目前發(fā)布了盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項(xiàng)較為重磅的行業(yè)大模型。
可以發(fā)現(xiàn),在商業(yè)模式上各個(gè)廠商都是通用大模型路徑,在通用大模型架構(gòu)之上,搭建具體行業(yè)模型。
映射到產(chǎn)業(yè)層面,即“通用大模型+產(chǎn)業(yè)模型”的路徑。
然而,手握入場券,并不代表能跑到終點(diǎn)。
對于廠商而言,其可以搭建通用大模型,并不意味著其能把通用大模型搭建的好;其有能力打通大模型到產(chǎn)業(yè)模型到具體場景的應(yīng)用,并不意味著其可以打造出有真正價(jià)值的智能決策。AI大模型產(chǎn)業(yè)化落地的瓶頸需要被正視。
首先,國內(nèi)大模型缺少數(shù)據(jù)訓(xùn)練場景。類似ChatGPT的訓(xùn)練場景尤為缺乏。
ChatGPT之所以短時(shí)間之內(nèi)進(jìn)步神速,因大量用戶為其充當(dāng)了免費(fèi)的數(shù)據(jù)標(biāo)注員。
不過,已目前情況來看,可與ChatGPT相較的數(shù)據(jù)訓(xùn)練場景在國內(nèi)還鮮有見到。
其次,產(chǎn)業(yè)界對大模型有著濃烈的觀望情緒。
業(yè)界普遍存在這樣的憂慮:目前大模型應(yīng)用不成熟,驟而上馬將會(huì)對原有業(yè)務(wù)造成沖擊。
以電商售后和銀行電話客服場景為例,目前行業(yè)內(nèi)仍采用主流智能客服公司推出的QA問答庫技術(shù)。
客戶企業(yè)希冀大模型產(chǎn)品能夠解決QA庫無法承擔(dān)的長尾問題,覆蓋到檢索式問答路徑無法涉足的領(lǐng)域,但金融行業(yè)的語料庫等數(shù)據(jù)又不對外開放,讓大模型企業(yè)不得不重頭開始。
這都延遲了大模型進(jìn)軍具體行業(yè)的時(shí)間表。
總結(jié)而言,通用智能企業(yè)需要客單價(jià)高、數(shù)據(jù)訓(xùn)練場景豐富的派單需求,但這個(gè)問題又與企業(yè)的現(xiàn)實(shí)考量和預(yù)算投入相互矛盾。
沒得數(shù)據(jù)用來訓(xùn)練、沒有大錢養(yǎng)活產(chǎn)品,是擺在現(xiàn)實(shí)的兩大難題。
一場屬于巨頭的游戲
如今,在大模型賽道中,擠滿了巨頭派、海歸派、創(chuàng)業(yè)公司轉(zhuǎn)型派、學(xué)院派等各路選手。
搶占大模型賽道頭牌的戰(zhàn)爭已經(jīng)徹底打響,但花落誰家還尚未可知。
目前,谷歌、微軟、亞馬遜、百度、阿里、騰訊等科技巨頭公司在大模型發(fā)展方面具有顯著的優(yōu)勢,均有相關(guān)雄厚的技術(shù)資源和能力,且都在通用大模型上進(jìn)行了布局與投資。
總體而言,大模型的分水嶺主要集中在技術(shù)研發(fā)、數(shù)據(jù)和算法資源、商業(yè)化能力、人才儲(chǔ)備和管理能力四個(gè)方面。
首先,在技術(shù)研發(fā)能力方面。就目前來看,巨頭擁有更強(qiáng)的技術(shù)研發(fā)能力和更豐富的資源,可以投入更多的人力、物力和財(cái)力來開展大模型的研究和開發(fā)。
他們擁有更完善的數(shù)據(jù)、算法和硬件等技術(shù)支持,能夠更快速地推進(jìn)大模型的研究和應(yīng)用。
對比巨頭和創(chuàng)業(yè)公司,技術(shù)上的差距在一定程度上取決于人工智能領(lǐng)域內(nèi)的領(lǐng)先者和后來者。
巨頭公司如Google、Facebook、Microsoft等在人工智能領(lǐng)域擁有大量的數(shù)據(jù)、計(jì)算資源和技術(shù)經(jīng)驗(yàn),因此有更多的能力來訓(xùn)練和優(yōu)化大模型,推動(dòng)人工智能技術(shù)的發(fā)展。
其次,在數(shù)據(jù)和算法資源方面,巨頭擁有更豐富和更完善的數(shù)據(jù)和算法資源,能夠更好地支持大模型的訓(xùn)練和推理。
他們能夠利用自身的平臺(tái)和業(yè)務(wù)優(yōu)勢來積累海量的數(shù)據(jù),并在此基礎(chǔ)上進(jìn)行算法研發(fā)和優(yōu)化。而創(chuàng)業(yè)公司通常無法獲得這樣的數(shù)據(jù)和算法資源,需要通過自己的努力來積累數(shù)據(jù)和優(yōu)化算法,這需要更多的時(shí)間和精力。
以O(shè)penAI發(fā)布于2020年的GPT-3來看,其具有1750億個(gè)參數(shù)的大模型。
在算力方面,人工智能模型的訓(xùn)練和使用需要強(qiáng)大的算力,這就需要大量高性能的GPU來支撐。
在數(shù)據(jù)方面,據(jù)了解,ChatGPT的訓(xùn)練使用了大約45TB數(shù)據(jù),其中包含多達(dá)近1萬億個(gè)單詞的文本內(nèi)容。
但是,由于大型模型需要大量的計(jì)算和存儲(chǔ)資源,對于初創(chuàng)公司來說,資金和技術(shù)限制可能成為了限制因素。
另外,在商業(yè)化能力方面,巨頭擁有更強(qiáng)的商業(yè)化能力和更完善的商業(yè)化渠道,能夠更好地將大模型應(yīng)用于商業(yè)領(lǐng)域,實(shí)現(xiàn)商業(yè)價(jià)值。
他們可以借助自身的品牌和用戶基礎(chǔ),將大模型應(yīng)用于搜索、推薦、廣告等領(lǐng)域,并實(shí)現(xiàn)商業(yè)化變現(xiàn)。由于創(chuàng)業(yè)公司大多缺乏這樣的商業(yè)化能力和渠道,需要花費(fèi)更多的時(shí)間和精力來探索商業(yè)化路徑和拓展商業(yè)合作。
最后,在人才儲(chǔ)備和管理能力方面,巨頭擁有更強(qiáng)的人才儲(chǔ)備和更完善的管理能力,能夠更好地吸引和管理高端人才,構(gòu)建更具競爭力的團(tuán)隊(duì)。
他們可以通過自身的品牌和聲譽(yù),吸引到更多的高端人才,并通過自身的管理經(jīng)驗(yàn)和制度建設(shè),提升團(tuán)隊(duì)的協(xié)作效率和創(chuàng)新能力。而創(chuàng)業(yè)公司通常需要付出更多的努力來構(gòu)建高端團(tuán)隊(duì)和提升管理能力。
雖然,隨著技術(shù)的不斷成熟,越來越多的創(chuàng)業(yè)公司也開始利用云計(jì)算、分布式計(jì)算等技術(shù)來加速大模型的訓(xùn)練和優(yōu)化,不斷挑戰(zhàn)巨頭公司的技術(shù)壟斷。
創(chuàng)業(yè)公司在人工智能領(lǐng)域也有很多機(jī)會(huì),但需要更多的創(chuàng)新和勇氣來打破技術(shù)壁壘和市場壟斷。
總之,大模型作為人工智能領(lǐng)域內(nèi)的重要技術(shù),已經(jīng)成為了熱門的創(chuàng)業(yè)領(lǐng)域。
巨頭公司擁有更多的資源和技術(shù)經(jīng)驗(yàn),而創(chuàng)業(yè)公司面對這個(gè)“燒錢”的領(lǐng)域,不宜盲目跟風(fēng),可以通過創(chuàng)新和勇氣來不斷挑戰(zhàn)技術(shù)壟斷,找到適合自己的業(yè)務(wù)發(fā)展之路。
來源:科技云報(bào)道
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美國無人機(jī)禁令升級(jí)?當(dāng)?shù)乜茖W(xué)家率先“喊疼”:我們離不開大疆
- iQOO Neo10 Pro:性能特長之外,亦有全能實(shí)力
- 自動(dòng)駕駛第一股的轉(zhuǎn)型迷途:圖森未來賭上了AIGC
- 明星熱劇、品牌種草、平臺(tái)資源,京東讓芬騰雙11的熱度“沸騰”了
- 一加 Ace 5 Pro明牌:游戲手機(jī)看它就夠了!
- 游戲體驗(yàn)天花板,一加 Ace 5 系列售價(jià) 2299 元起
- 16個(gè)月沒工資不敢離職,這些打工人“自費(fèi)上班”
- 怎樣利用微信小店“送禮”功能賺錢?
- 鴻蒙智行問界M9,中國豪華車的龍門一躍
- 科技云報(bào)道:人工智能時(shí)代“三大件”:生成式AI、數(shù)據(jù)、云服務(wù)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。