中科院院士張鈸:發(fā)展第三代人工智能,需要產(chǎn)學(xué)研共同努力

在12月23日舉辦的2023華為云AI院長峰會上,中國科學(xué)院院士、清華大學(xué)人工智能研究院名譽院長張鈸發(fā)表視頻致辭,對大模型的價值、面臨的治理問題以及未來的發(fā)展方向進行了分享。

中國科學(xué)院院士、清華大學(xué)人工智能研究院名譽院長張鈸發(fā)表視頻致辭

大模型向通用AI邁出一步

大語言模型能夠通過學(xué)習(xí)和理解人類的語言來進行對話,還能根據(jù)聊天的上下文進行互動,真正像人類一樣來聊天交流,甚至能完成撰寫新聞、郵件、視頻腳本、文案、翻譯、代碼等任務(wù)。對此,張鈸院士表示,與真人對話很接近,達到行為主義所追求的目標(biāo),這是AI里程碑式的成就。

張鈸認為,相較第一代AI的知識驅(qū)動模型、第二代AI的數(shù)據(jù)驅(qū)動模型,突破特定的領(lǐng)域、利用特定的模型、實現(xiàn)特定的任務(wù)三個特定,向通用AI(AGI)邁出了一步。

對AI的治理需要從模型和使用角度出發(fā)

大模型的出現(xiàn),使傳統(tǒng)人工智能向生成式人工智能轉(zhuǎn)變,為所有人工智能企業(yè)打開一扇新的大門,也將為AI產(chǎn)業(yè)發(fā)展帶來新的機遇。

第一,促進AI科技革命。張鈸解釋,信息科學(xué)技術(shù)發(fā)展速度快是因為其在發(fā)展初期就打下了堅實的理論基礎(chǔ),但AI至今沒有理論,AI已有的模型和算法都是針對具體領(lǐng)域和具體任務(wù),難以建立通用的理論。但與第一代和第二代AI不同,大模型突破了三個特定,使可解釋和魯棒的AI理論成為可能,將會極大地推動AI科技的迅速發(fā)展。

第二,推動AI產(chǎn)業(yè)變革。受單領(lǐng)域和單任務(wù)的限制,AI的應(yīng)用和產(chǎn)業(yè)化總是被限制于狹小的領(lǐng)域。但目前大模型已經(jīng)從生成文本擴大到生成其他模態(tài),可以使用通用的模型生成多樣性的人類水平的圖像、聲音、視頻和代碼等。大模型通過微調(diào)可以滿足不同領(lǐng)域和任務(wù)的需求,與知識庫和其他工具結(jié)合,可以極大地擴大AI產(chǎn)業(yè)與應(yīng)用的發(fā)展空間,有可能使AI產(chǎn)業(yè)進入新的發(fā)展階段。

此外,大模型的發(fā)展也帶來了一些挑戰(zhàn)。第一,大模型目前僅在自然語言處理和編程等少數(shù)任務(wù)上做到了通用性,在諸如決策、博弈等領(lǐng)域能否實現(xiàn)通用性仍有待研究。

第二,大模型利用預(yù)測下一個詞的自監(jiān)督學(xué)習(xí)方法學(xué)習(xí)文本和生產(chǎn)文本,與人類的文本學(xué)習(xí)和語言生產(chǎn)的原理完全不同。這使得其具有三個本質(zhì)性的缺陷,一是輸出質(zhì)量不一致,且不可控,存在犯大錯誤的可能性;二是受提示詞(輸入詞)影響很大,輸出魯棒性比較差;三是沒有自知之明,難以自我發(fā)現(xiàn)錯誤和糾正錯誤。

基于其缺陷,大模型生成不符合道德倫理、政治標(biāo)準的內(nèi)容比較常見,需要通過AI對齊來解決,這屬于對模型的治理問題。同時大模型輸出的正確內(nèi)容也可能被誤用和濫用,因此需要對使用者進行治理。在AI發(fā)展過程中,必須處理好發(fā)展和治理之間的關(guān)系,以保證AI的健康發(fā)展。

發(fā)展第三代人工智能需要產(chǎn)學(xué)研共同努力

盡管眼下GPT只能以人機對話的形式呈現(xiàn),存在種種局限,但也向通用型人工智能的方向邁了一步。如何使AI走向通用的道路?張鈸指出,“必須發(fā)展第三代人工智能。”

張鈸認為,發(fā)展第三代人工智能的任務(wù)包括,第一,建立可解釋和魯棒的 AI 理論。第二,發(fā)展安全可信、可控、可靠和可擴展的AI技術(shù)。第三,推動AI的創(chuàng)新應(yīng)用和產(chǎn)業(yè)發(fā)展。

要實現(xiàn)這個任務(wù),張鈸表示,需要把知識、數(shù)據(jù)、算法和算力充分利用起來,通過文本語義向量表示、多頭注意機制的轉(zhuǎn)換器、自監(jiān)督學(xué)習(xí)這三個關(guān)鍵技術(shù),實現(xiàn)了從過去只是把文本當(dāng)成數(shù)據(jù)來處理,轉(zhuǎn)變?yōu)閷ξ谋镜膬?nèi)容及文本所包含知識的處理,這是關(guān)鍵性的一步。

張鈸指出,發(fā)展第三代人工智能,還需要產(chǎn)學(xué)研共同努力,把基礎(chǔ)研究、技術(shù)創(chuàng)新和產(chǎn)業(yè)化三者結(jié)合起來。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )