中國聯(lián)通為何進軍大模型?將如何布局?

7月14日消息(作者:劉定洲,程唯珈)今年初以來,ChatGPT橫空出世,引爆新一輪機器學(xué)習(xí)革命,大模型成為炙手可熱的科技新賽道。據(jù)不完全統(tǒng)計,國內(nèi)已有近百個大模型產(chǎn)品面世。

在大模型產(chǎn)業(yè)生態(tài)中,運營商沒有缺席。運營商擁有強大的底層算力和網(wǎng)絡(luò)基礎(chǔ)設(shè)施,而且近年來不斷加強研發(fā)投入,已有較為充分的技術(shù)積累。目前,三大運營商均發(fā)布了各自的大模型產(chǎn)品,其中,中國聯(lián)通在MWC上海2023期間發(fā)布了鴻湖圖文大模型1.0。

鴻湖圖文大模型是首個面向運營商增值業(yè)務(wù)的大模型,具備以文生圖、視頻剪輯、以圖生圖等多種功能。日前,中國聯(lián)通研究院智能技術(shù)研究部大模型項目負(fù)責(zé)人吳浩然接受媒體采訪,對中國聯(lián)通在大模型領(lǐng)域的布局進行了觀點分享。

大模型將成為新一代流量入口

吳浩然首先強調(diào),大模型是人工智能新一輪爆發(fā)的轉(zhuǎn)折點,也是AGI(通用人工智能)時代的原點。其泛化能力將AI從過去單一場景適配的方式解放,類似工業(yè)革命從小作坊生產(chǎn)發(fā)展為工廠批量化生產(chǎn),這意味著根本性的改變。

同時,隨著大模型語言能力的發(fā)展以及目前的混合專家系統(tǒng)模式,以自然語言交互大模型做“管家”的模式,很可能會成為下一個時代的主流。如中信智庫的報告所言,大模型將成為新一代流量入口。

做流量生意正是運營商的強項。吳浩然表示,從商業(yè)價值角度講,中國聯(lián)通布局大模型領(lǐng)域是非常必要的。運營商在移動互聯(lián)網(wǎng)時代未能利用好流量,成為了“管道運營商”,在智能互聯(lián)時代必須積極嘗試轉(zhuǎn)變,成為新時代的“綜合數(shù)字服務(wù)運營商”。

吳浩然還認(rèn)為,隨著大模型技術(shù)進一步發(fā)展,極有可能成為新時代的操作系統(tǒng)。而美國對我國科技封鎖愈加嚴(yán)苛,除芯片外,在大模型方面實際上也在加強打壓。為防止重蹈過去很多工業(yè)軟件被“卡脖子”的覆轍,中國聯(lián)通和其他運營商作為央企中在AI方向較強的企業(yè),布局大模型也符合國家政府期許,是中國聯(lián)通積極承擔(dān)央企責(zé)任的體現(xiàn)。

鴻湖圖文大模型優(yōu)勢解析

目前,云計算、AI、互聯(lián)網(wǎng)、游戲等領(lǐng)域企業(yè)都在發(fā)布大模型產(chǎn)品,市場上已是“百模大戰(zhàn)”。那么,中國聯(lián)通的鴻湖圖文大模型,有何差異化優(yōu)勢?

吳浩然表示,鴻湖圖文大模型不同于政務(wù)、客服等純語言模型,從一開始就是圖文雙模態(tài)的模型。“其實我們布局大模型相對較早,在2021年即開始了相關(guān)技術(shù)研究,目前的鴻湖是在2022年即啟動研發(fā),當(dāng)時ChatGPT尚未出現(xiàn),Midjourney、Stable Diffusion這類文生圖模型也還在醞釀。隨著5G新通信的功能強化,我們從公眾線的增值業(yè)務(wù)場景出發(fā),瞄準(zhǔn)了圖文雙模態(tài)。”

鴻湖圖文大模型的差異化優(yōu)勢是特征融合,將不同模態(tài)內(nèi)容對齊到文本,來實現(xiàn)跨模態(tài)的內(nèi)容理解。據(jù)介紹,中國聯(lián)通采取了Encoder-Decoder模式,這種模式在生成任務(wù)上靈活性相較Decoder-only弱,但在理解能力上更強,更符合做跨模態(tài)理解的需求。

吳浩然表示,鴻湖圖文大模型目前是圖文,也可以將提取部分改為圖聲或其他模態(tài)提取器,同樣進行特征融合和跨模態(tài)對比學(xué)習(xí)后,可以很容易擴展至其他跨模態(tài),最終實現(xiàn)不同模態(tài)在文本語義上統(tǒng)一的目標(biāo)。“松耦合和強擴展性特征,也構(gòu)成了競爭力的一環(huán)。只要我們做好模態(tài)融合部分,特征提取就可以時刻選取市面最好的模型來替換,保持我們模型的活力。”

大模型四大發(fā)展趨勢

在研發(fā)鴻湖圖文大模型的同時,中國聯(lián)通也在探討大模型產(chǎn)業(yè)的未來發(fā)展趨勢。在吳浩然看來,主要有四大趨勢:

首先,模態(tài)融合一定是最大的趨勢。單模態(tài)的仍稱不上AGI,融合所有模態(tài)再進一步發(fā)展后,才能迎來AGI。

其次,混合專家系統(tǒng)類思路是目前大模型落地比較優(yōu)質(zhì)的路徑。過去十幾年來,人工智能尤其是深度學(xué)習(xí)技術(shù)的發(fā)展積累了很多優(yōu)質(zhì)的模型,將大模型與這些模型結(jié)合,乃至將大模型與各類數(shù)字化系統(tǒng)結(jié)合、與機器部件結(jié)合,將是未來大模型由純數(shù)字經(jīng)濟,向數(shù)字經(jīng)濟賦能實體經(jīng)濟轉(zhuǎn)變的重要途徑。

再次,大模型稀疏化是未來大模型落地的重要路徑之一。當(dāng)前大模型參數(shù)量仍呈快速增長態(tài)勢,稠密大模型的計算推理勢必將占用極大的算力資源,阻礙大模型的快速落地和泛在服務(wù)。而大模型稀疏化將極大降低大模型的部署成本,提高推理速度,使大模型真正“飛入尋常百姓家”。

最后,大模型短期內(nèi)仍會以C端場景為主落地。B端由于存在大量判別式場景,仍需模型能力進一步增強。但長期來看,能否解決判別式場景的高精度同時保持高度泛化能力,是未來大模型能否在B端廣泛應(yīng)用的決定性因素,可以說C端決定未來大模型下限,B端決定上限。

基于對未來的趨勢判斷,吳浩然強調(diào),中國聯(lián)通將持續(xù)投資大模型賽道。目前來看,中國聯(lián)通面臨大模型研發(fā)人才積累不足、相關(guān)賽道的產(chǎn)品化經(jīng)驗不足等挑戰(zhàn),正在努力補強。同時,大模型雖然喧囂,還處在Gartner技術(shù)成熟度曲線頂峰的左側(cè),是一個長線賽道。中國聯(lián)通對于大模型的未來,擁有足夠的信心。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-07-14
中國聯(lián)通為何進軍大模型?將如何布局?
中國聯(lián)通為何進軍大模型?將如何布局?,C114訊 7月14日消息(作者:劉定洲,程唯珈)今年初以來,ChatGPT橫空出世,引爆新一輪機器

長按掃碼 閱讀全文