文心耀烏鎮(zhèn),“大模型之光”展現(xiàn)了什么?

“烏鎮(zhèn)的小橋流水,能照見全球科技的風(fēng)起云涌?!?/p>

多年以來,伴隨著中國科技的騰飛,以及世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)的連續(xù)成功舉辦,這句話已經(jīng)成為全球科技產(chǎn)業(yè)的共識(shí)。烏鎮(zhèn)是科技與互聯(lián)網(wǎng)的風(fēng)向標(biāo)、晴雨表,也是無數(shù)新故事開始的地方。

而今年的烏鎮(zhèn),主題似乎只有一個(gè)——人工智能。

11月8日,2023年世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)正式開幕,而這一屆峰會(huì)的特點(diǎn),就是無處不彌漫著AI的氣息。大模型的崛起與發(fā)展成為最受關(guān)注的議題,各個(gè)論壇探索著大模型的種種未來,每位企業(yè)家都在擘畫著大模型時(shí)代的產(chǎn)業(yè)藍(lán)圖。

在這樣的盛大舞臺(tái)上,誰才是最能代表中國AI科技實(shí)力的“大模型之光”?伴隨著“世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng)”的頒布,我們也看到了答案。

可以看到,在眾多參選技術(shù)成果中,百度知識(shí)增強(qiáng)大語言模型關(guān)鍵技術(shù)獲得了“世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng)”,而這也是大模型領(lǐng)域唯一的獲獎(jiǎng)成果。

百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰,在現(xiàn)場發(fā)布了文心大模型的關(guān)鍵技術(shù)成果。他表示,“人工智能正在引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革,大語言模型讓人們看到了通用人工智能的曙光。知識(shí)增強(qiáng)大語言模型關(guān)鍵技術(shù),突破知識(shí)內(nèi)化和外用技術(shù),具備知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)的獨(dú)有技術(shù)優(yōu)勢(shì),并通過模型與框架聯(lián)合優(yōu)化,突破了訓(xùn)練規(guī)模,提高了訓(xùn)練效率,提升了模型效果”。

世界科技看烏鎮(zhèn),烏鎮(zhèn)大模型看文心。

在文心大模型4.0成熟的技術(shù)路線與工程化能力受到廣泛認(rèn)可背后,我們可以看到更廣闊的未來。比如大模型產(chǎn)業(yè)的發(fā)展方向,中國科技新十年的創(chuàng)新底座,以及新科技革命的光明前路。

烏鎮(zhèn)十年,故事新篇由文心領(lǐng)啟

從2014年到2023年,世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)剛好走過了十年歲月。因此今年的烏鎮(zhèn)峰會(huì)有很多格外讓人感慨的地方。在十年之前,AI技術(shù)還在烏鎮(zhèn)舞臺(tái)上并沒有得到廣泛關(guān)注。而在今天,烏鎮(zhèn)已經(jīng)呈現(xiàn)出了無處不講AI,無人不說大模型的盛況。

很多人認(rèn)為,烏鎮(zhèn)十年剛好是一個(gè)分水嶺,它標(biāo)志著移動(dòng)互聯(lián)網(wǎng)為主導(dǎo)的產(chǎn)業(yè)周期告一段落,以大模型為主導(dǎo)的AI時(shí)代正式到來。

而這個(gè)十年變革最具代表性的一幕,就發(fā)生在領(lǐng)先科技獎(jiǎng)的頒獎(jiǎng)臺(tái)上。

世界互聯(lián)網(wǎng)領(lǐng)先科技成果是由世界互聯(lián)網(wǎng)大會(huì)組織的評(píng)選活動(dòng)。它面向全球廣泛征集前沿科技申報(bào)成果,通過評(píng)審評(píng)出具有國際代表性的年度領(lǐng)先科技成果。這一活動(dòng)自2016年起連續(xù)舉辦,如今已經(jīng)在全球科技與互聯(lián)網(wǎng)產(chǎn)業(yè)中發(fā)揮了舉足輕重的影響。

今年,活動(dòng)全面升級(jí)為世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng),并首次分為關(guān)鍵技術(shù)、基礎(chǔ)研究、工程研發(fā)三類,面向全球表彰年度領(lǐng)先互聯(lián)網(wǎng)科技成果。據(jù)了解,今年參選的科技成果多達(dá)246項(xiàng),涵蓋AI、大數(shù)據(jù)、5G、車聯(lián)網(wǎng)等領(lǐng)域。

而在今年大模型崛起,AI時(shí)代到來的背景下,誰能摘得大模型領(lǐng)域的領(lǐng)先成果獎(jiǎng)就變得意義非凡。經(jīng)過40名海內(nèi)外專家評(píng)審,百度知識(shí)增強(qiáng)大語言模型關(guān)鍵技術(shù)成為唯一獲獎(jiǎng)的大模型技術(shù)??梢哉f,文心大模型的獲獎(jiǎng),領(lǐng)啟了烏鎮(zhèn)新十年的AI故事,開啟了全球互聯(lián)網(wǎng)走向大模型時(shí)代的變革序曲。

文心大模型獲獎(jiǎng)究竟為什么能奪得如此關(guān)鍵的獎(jiǎng)項(xiàng)?其獲獎(jiǎng)的宏觀意義究竟是什么?

核心技術(shù)與工程化路徑,“大模型之光”展現(xiàn)了什么?

獲得了世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng)的文心大模型,毫無疑問可以被稱為中國的“大模型之光”。而在一系列產(chǎn)業(yè)界、學(xué)術(shù)界認(rèn)可,以及開發(fā)者、用戶的廣泛支持中,文心究竟做對(duì)了什么,是一個(gè)值得深入思考的問題。

從技術(shù)內(nèi)核上看,文心大模型最為關(guān)鍵的是知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)等獨(dú)有技術(shù)優(yōu)勢(shì)。

在知識(shí)增強(qiáng)方面,文心大模型可以從數(shù)萬億數(shù)據(jù)和數(shù)千億知識(shí)中融合學(xué)習(xí),把知識(shí)內(nèi)化至模型參數(shù)中,同時(shí)靈活高效地運(yùn)用外部知識(shí),最終實(shí)現(xiàn)模型效果更好,效率更高。

在檢索增強(qiáng)方面,文心大模型采用了基于語義理解與匹配的新一代搜索架構(gòu),能夠?yàn)橛脩籼峁└珳?zhǔn)的搜索結(jié)果,與生成模型聯(lián)合優(yōu)化,最終讓輸出的內(nèi)容準(zhǔn)確率更高、時(shí)效性更強(qiáng)。

在對(duì)話增強(qiáng)方面,文心大模型基于領(lǐng)先的通用對(duì)話技術(shù),提升大語言模型的上下文理解、對(duì)話規(guī)劃及記憶能力,使對(duì)話的連貫性和合理性更好。

在工程化領(lǐng)域,文心大模型展現(xiàn)出了業(yè)界矚目的極高迭代效率。并通過模型與框架聯(lián)合優(yōu)化,突破了訓(xùn)練規(guī)模,提高了訓(xùn)練效率,提升了模型效果。目前,文心一言的基礎(chǔ)模型已迭代到文心大模型4.0版本。在文心大模型和飛槳深度學(xué)習(xí)平臺(tái)聯(lián)合優(yōu)化下,文心大模型4.0的訓(xùn)練算法效率已經(jīng)提升到3月發(fā)布時(shí)的 3.6 倍,推理能力提升了超過50 倍。

在這些關(guān)鍵技術(shù)支撐下,文心大模型在全球多個(gè)公開測(cè)試中實(shí)現(xiàn)了技術(shù)效果領(lǐng)先。百度知識(shí)增強(qiáng)大語言模型相關(guān)技術(shù)先后獲得了國家技術(shù)發(fā)明二等獎(jiǎng)、中國專利金獎(jiǎng)、吳文俊人工智能科技進(jìn)步特等獎(jiǎng)、中國電子學(xué)會(huì)科技進(jìn)步一等獎(jiǎng)等。

核心技術(shù)有可持續(xù)發(fā)展的差異化優(yōu)勢(shì),工程化能力與模型迭代效率極強(qiáng)。這兩點(diǎn)構(gòu)成了文心大模型的發(fā)展方案,也形成了中國大模型在全球AI競賽中的代表性能力。當(dāng)文心大模型的技術(shù)底座,結(jié)合廣大開發(fā)者的應(yīng)用創(chuàng)新能力,千行百業(yè)的智能化需求——大模型之光,最終會(huì)點(diǎn)亮中國AI的發(fā)展之光,世界互聯(lián)網(wǎng)科技的進(jìn)步之光。

多年積累,終為科技革命照見前路

托馬斯·庫恩在《科學(xué)革命的結(jié)構(gòu)》中說,科學(xué)家由一個(gè)新范式指引,去采用新工具,注意新領(lǐng)域,最終在科技革命之后,我們會(huì)面對(duì)一個(gè)完全不同的世界。

在文心大模型獲獎(jiǎng)背后,真正值得被看見的是百度在AI技術(shù)上的多年積累,不斷為科學(xué)家、產(chǎn)業(yè)界提供新工具,打開新領(lǐng)域。最終,有望通過AI技術(shù)推動(dòng)新一代科技革命到來,幫助互聯(lián)網(wǎng)產(chǎn)業(yè),乃至整體社會(huì)經(jīng)濟(jì)抵達(dá)一個(gè)新的世界。

事實(shí)上,在文心大模型獲獎(jiǎng)之前,百度已經(jīng)通過百度大腦、小度助手(DuerOS)、Apollo、飛槳,先后四次獲得世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技成果。這些獎(jiǎng)項(xiàng)展示了百度如何一步步探索AI技術(shù)的可能性,最終通過不斷的技術(shù)積累,去敲開新科技革命的大門。

在今天,大模型技術(shù)的發(fā)展與成型,進(jìn)一步照亮了科技革命的前路。在百度看來,我們已經(jīng)有了擁抱變革的清晰目標(biāo)與實(shí)現(xiàn)方式。我們可以通過三個(gè)角度,來總結(jié)文心大模型背后,百度的AI技術(shù)思考。

首先,AI工業(yè)大生產(chǎn),是新科技革命的實(shí)現(xiàn)方式。

王海峰表示,人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,深度學(xué)習(xí)作為人工智能的核心技術(shù),具有很強(qiáng)的通用性,并具備標(biāo)準(zhǔn)化、自動(dòng)化和模塊化的工業(yè)大生產(chǎn)特征,而大模型的興起,使得人工智能應(yīng)用的深度和廣度進(jìn)一步拓展。人工智能已進(jìn)入工業(yè)大生產(chǎn)階段。

面向未來,大模型將從更多領(lǐng)域推動(dòng)AI技術(shù)的標(biāo)準(zhǔn)化、自動(dòng)化和模塊化,從而不斷降低AI技術(shù)的應(yīng)用門檻,提升其場景化落地的便捷性。這些工業(yè)化大生產(chǎn)特征的積累和聚合,將推動(dòng)新科技革命到來,加速產(chǎn)業(yè)智能化升級(jí),最終創(chuàng)造社會(huì)生產(chǎn)力的巨大爆發(fā)。

其次,“芯片代工廠模式”,是適配大模型發(fā)展的產(chǎn)業(yè)路徑。

大模型有著重投入、廣應(yīng)用的產(chǎn)業(yè)特征,這就導(dǎo)致其前期成本巨大,有著不小的產(chǎn)業(yè)挑戰(zhàn)。面對(duì)這一挑戰(zhàn),王海峰表示大模型可以采用類似芯片代工廠的產(chǎn)業(yè)模式。通過“集約化生產(chǎn),平臺(tái)化應(yīng)用”模式,讓具有算法、算力和數(shù)據(jù)綜合優(yōu)勢(shì)的企業(yè)將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺(tái),為千行百業(yè)提供大模型服務(wù)。

目前,這一產(chǎn)業(yè)化路徑已在文心大模型產(chǎn)業(yè)實(shí)踐中得到驗(yàn)證,百度與合作伙伴共建了包括能源、金融、航天、制造、傳媒、城市、社科以及影視等10余個(gè)行業(yè)大模型,加速大模型產(chǎn)業(yè)化落地。

此外,AI加強(qiáng)理解、生成、邏輯、記憶四大能力,將帶領(lǐng)我們走向AGI的曙光。

王海峰認(rèn)為,人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的基礎(chǔ)能力,這四項(xiàng)能力越強(qiáng),越接近通用人工智能。大語言模型具備了這四項(xiàng)能力,且越來越強(qiáng),為通用人工智能帶來了曙光。

在構(gòu)建基礎(chǔ)底座、探索產(chǎn)業(yè)路徑、錨定未來方向等領(lǐng)域,百度對(duì)AI技術(shù)與大模型進(jìn)行了廣泛且持續(xù)的投入。最終也收獲了來自產(chǎn)學(xué)各界、開發(fā)者、用戶的積極反饋。文心一言自8月31日面向全社會(huì)開放至今,用戶規(guī)模已經(jīng)達(dá)到7000萬,構(gòu)建場景超過4300個(gè),助力開發(fā)應(yīng)用2492個(gè)。飛槳和文心生態(tài)已凝聚800萬開發(fā)者,服務(wù)22萬家企事業(yè)單位,創(chuàng)建了80萬個(gè)模型。

文心閃耀烏鎮(zhèn)的最大價(jià)值,是百度持續(xù)的AI探索,正在成長為業(yè)界共識(shí),發(fā)展成社會(huì)底座,凝聚為照亮新科技革命前路的燈塔。

而這些成果,將讓AI之花綻放在中國大地上,盛開出烏鎮(zhèn)故事新十年的智能花海。文心耀烏鎮(zhèn),AI綻神州,正在成為目之所及的風(fēng)景。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-11-11
文心耀烏鎮(zhèn),“大模型之光”展現(xiàn)了什么?
文心耀烏鎮(zhèn),“大模型之光”展現(xiàn)了什么?

長按掃碼 閱讀全文