4 月 13 日,由稀土掘金技術(shù)社區(qū)和 Intel 聯(lián)合主辦的 2023 第一期掘金城市沙龍「 AIGC 技術(shù)探索與應(yīng)用創(chuàng)新」在北京成功舉辦。本期沙龍聚焦時下最熱的科技話題——AIGC,通過線上線下聯(lián)動,從“技術(shù)”和“應(yīng)用”雙視角探索 AIGC 爆發(fā)式繁榮背后“算力、算法、數(shù)據(jù)”三大底層能力建設(shè),暢想未來新的產(chǎn)業(yè)結(jié)構(gòu)樣態(tài)與應(yīng)用創(chuàng)新形式的可能性,在行業(yè)內(nèi)引發(fā)熱烈反響。
本期沙龍分為大咖分享和圓桌 Panel 兩大議程,沙龍現(xiàn)場英特爾 AI 軟件工程師楊亦誠、字節(jié)跳動 NLP 算法工程師陳家澤、Google Cloud 機(jī)器學(xué)習(xí)專家王順、清華大學(xué) KEG 知識工程實驗室研究助理鄭勤鍇、九合創(chuàng)投投資副總裁王逸飛、稀土掘金江昪一一帶來精彩觀點,同大家一道迎接“未來已來,將至未至”的 AIGC 時代。
AIGC 的底層邏輯:以大模型為“道”,衍生萬物
左起:楊亦誠 王順 鄭勤鍇 陳家澤
ChatGPT 爆火,引發(fā)中國互聯(lián)網(wǎng)科技圈對多模態(tài)大模型的關(guān)注。在國內(nèi),大模型市場更是開始躁動起來了,文心一言、盤古、通義千問、日日新SenseNova......可以說,從算力到應(yīng)用,人工智能領(lǐng)域在大模型賽道上已然按下快捷鍵。然而,大模型仍處于從實驗室走向大規(guī)模商業(yè)化的早期階段,存在核心技術(shù)不成熟,生態(tài)系統(tǒng)不健全,且成熟落地場景較少等問題。
英特爾 AI 軟件工程師楊亦誠也表示,基于“大算力”和“強(qiáng)算法”兩大顯著特點,AIGC 類的大模型不僅從算力維度給產(chǎn)業(yè)帶來新的技術(shù)挑戰(zhàn),更從商業(yè)模型上帶來了突破和變革,可以預(yù)見模型服務(wù)化勢必成為人工智能企業(yè)未來的核心商業(yè)模式。
盡管視覺相關(guān)的 AIGC 領(lǐng)域發(fā)展很猛,但是文本仍是 AIGC 中最重要的一環(huán),是連接不同模態(tài)內(nèi)容的重要媒介。字節(jié)跳動 NLP 算法工程師陳家澤表示,文本生成技術(shù)發(fā)展至今,從 Encoder Decoder 結(jié)構(gòu)的第一次變革,之后各種文本生成的應(yīng)用如同雨后春筍般被提出,到 GPT 結(jié)構(gòu)的發(fā)展,整體文本生成范式發(fā)生演進(jìn),過程中帶來更多的可能性,同時也面臨非常多的挑戰(zhàn),比如數(shù)據(jù)隱私和安全的要求越來越高,模型需要具有高可靠性和透明度等等。
同時,隨著高質(zhì)量 AIGC 的大規(guī)模普及,千億規(guī)模大模型的訓(xùn)練不再高不可攀。Google Cloud 機(jī)器學(xué)習(xí)專家王順也介紹到,Google不斷推出的 LaMDA、Imagen、PaLM、Parti 等生成任務(wù)大模型也打磨出了 PAX 這種輕松訓(xùn)練千億規(guī)模參數(shù)的大模型框架,隨著 Cloud TPU v4 對外部客戶的 GA, 您也可以在 Google Cloud 上輕松訓(xùn)練一個屬于自己的千億參數(shù)大模型。
在代碼生成的場景中,清華大學(xué) KEG 知識工程實驗室研究助理鄭勤鍇介紹,CodeGeeX正在成為 Github Copilot 的平替,未來絕大多數(shù)代碼都將由AI驅(qū)動產(chǎn)生,每個開發(fā)者都需要尋找成為 AI2.0 程序員的路徑。
AI 的 iPhone 時刻:內(nèi)卷的大模型,擁抱變化的開發(fā)者
AIGC 大模型的參數(shù)天花板在哪里?人工智能是否會取代重復(fù)性勞動......面對這些問題,作為圓桌主持人,稀土掘金江昪與一眾嘉賓專家從技術(shù)、商業(yè)模式、創(chuàng)新等視角,探討人類之于 AI 以及 AIGC 自身下一步怎么走?
左起:江昪 王逸飛 鄭勤鍇 陳家澤 楊亦誠
隨著自然語言處理與擴(kuò)散模型的發(fā)展,未來的 AIGC 必然具有極高接近性與創(chuàng)造力。也因此,英偉達(dá)CEO黃仁勛四度使用“iPhone時刻”,來形容AI當(dāng)下的發(fā)展。清華大學(xué) KEG 知識工程實驗室研究助理鄭勤鍇也表示,AI 帶來了交互方式上的變革,極大地提高人們使用各種工具的效率。
2020 年,OpenAI 提出了大模型的縮放法則,也就是說增大參數(shù)規(guī)??梢詷O大提升模型性能,由此進(jìn)入了煉大模型的“狂飆”時代。而相比于 GPT-3 模型 1750 億參數(shù)量而言,關(guān)于 GPT-4 模型參數(shù)量在業(yè)界引發(fā)持續(xù)性猜想??梢源_定的是,目前模型的參數(shù)量遠(yuǎn)未到達(dá)瓶頸。九合創(chuàng)投投資副總裁王逸飛認(rèn)為,如果在硬件側(cè)沒有一個重大突破,可能未來 2、3 年內(nèi)沿著 transformer 路徑走的大模型會走到上限。AGI 是一個很長的探索路徑,未來肯定會有新的算法出來,而目前的 GPT 只是走出最靠前的一步,它很有可能只是我們探索 AGI 的中間態(tài)。
字節(jié)跳動 NLP 算法工程師陳家澤也表示,未來可能有兩條路:一是一部分的模型越來越大,同時也會越來越強(qiáng);二是在一個差不多量級的模型下水平越來越高,比如可能 7B、 10B 的模型的能力通過一些訓(xùn)練方式、數(shù)據(jù)調(diào)優(yōu),具備更加充分的能力。
眼下,AIGC 領(lǐng)域熱火朝天,國內(nèi)越來越多的科技企業(yè)扎堆入場。王逸飛也表示,目前,AI 遠(yuǎn)未到達(dá)最后階段,國內(nèi)企業(yè)或團(tuán)隊需要面臨最大的挑戰(zhàn)是,如何在沒有明確未來的事情的上敢于做投入,選擇技術(shù)路線。
那么,AI 是否會取代重復(fù)勞動力的工作,對于包括開發(fā)者在內(nèi)從業(yè)者來說也是一個難題。鄭勤鍇則認(rèn)為,短期內(nèi)程序員是不太會被替代的,但未來的趨勢可能會分成會用 ChatGPT 和不會用 ChatGPT 這兩類程序員,在此基礎(chǔ)上,對于程序員提出更高的要求,就是 ChatGPT 生成的代碼并不是完全可信的,這時候就要求程序員能判斷 ChatGPT 生成代碼的質(zhì)量。
AI 的長期價值,對各行各業(yè)的顛覆性改變,一切才剛剛開始。從技術(shù)研發(fā)到商用階段,再逐步走進(jìn)現(xiàn)實生活場景中,往往需要一代又一代的開發(fā)者持續(xù)探索和完善,在每一次的技術(shù)交流中,凝聚共識,找到新的立身之本。今后,稀土掘金技術(shù)社區(qū)還會一如既往地為企業(yè)、技術(shù)人員創(chuàng)建一個觀點碰撞的平臺,實現(xiàn)雙向賦能。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )