浪潮發(fā)布全球最大規(guī)模人工智能巨量模型“源”

9月28日,浪潮人工智能研究院在京發(fā)布全球最大規(guī)模人工智能巨量模型 “源1.0”。“源”的單體模型參數(shù)量達2457億,超越美國OpenAI組織研發(fā)的GPT-3,成為全球最大規(guī)模的AI巨量模型。“源1.0研討會”同期舉行,來自國內(nèi)相關(guān)領(lǐng)域的院士、專家出席了研討會,對AI巨量模型的創(chuàng)新與應用進行了深入研討交流。

源1.0模型參數(shù)規(guī)模為2457億,訓練采用的中文數(shù)據(jù)集達5000GB,相比GPT3模型1750億參數(shù)量和570GB訓練數(shù)據(jù)集,源1.0參數(shù)規(guī)模領(lǐng)先40%,訓練數(shù)據(jù)集規(guī)模領(lǐng)先近10倍。

“源1.0”在語言智能方面表現(xiàn)優(yōu)異,獲得中文語言理解評測基準CLUE榜單的零樣本學習和小樣本學習兩類總榜冠軍。在零樣本學習榜單中,“源1.0”超越業(yè)界最佳成績18.3%,在文獻分類、新聞分類,商品分類、原生中文推理、成語閱讀理解填空、名詞代詞關(guān)系6項任務中獲得冠軍;在小樣本學習的文獻分類、商品分類、文獻摘要識別、名詞代詞關(guān)系等4項任務獲得冠軍。在成語閱讀理解填空項目中,源1.0的表現(xiàn)已超越人類得分。

浪潮發(fā)布全球最大規(guī)模人工智能巨量模型“源”

ZeroCLUE零樣本學習榜(第一行為人類得分)

浪潮發(fā)布全球最大規(guī)模人工智能巨量模型“源”

FewCLUE小樣本學習榜(第一行為人類得分)

在對“源1.0”進行的“圖靈測試”中,將源1.0模型生成的對話、小說續(xù)寫、新聞、詩歌、對聯(lián)與由人類創(chuàng)作的同類作品進行混合并由人群進行分辨,測試結(jié)果表明,人群能夠準確分辨人與“源1.0”作品差別的成功率已低于50%。

巨量模型的發(fā)展備受關(guān)注。斯坦福大學李飛飛教授等人工智能領(lǐng)域知名學者近期在論文中表示,這類巨量模型的意義在于突現(xiàn)和均質(zhì)。突現(xiàn)意味著通過巨大模型的隱含的知識和推納可帶來讓人振奮的科學創(chuàng)新靈感出現(xiàn);均質(zhì)表示巨量模型可以為諸多應用任務泛化支持提供統(tǒng)一強大的算法支撐。

源1.0中文巨量模型的發(fā)布,使得中國學術(shù)界和產(chǎn)業(yè)界可以使用一種通用巨量語言模型的方式,大幅降低針對不同應用場景的語言模型適配難度;同時提升在小樣本學習和零樣本學習場景的模型泛化應用能力。

浪潮人工智能研究院表示,“源1.0”將面向?qū)W術(shù)研究單位和產(chǎn)業(yè)實踐用戶進行開源、開放、共享,降低巨量模型研究和應用的門檻,有效推進AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化的進步,切實為國家在人工智能研究創(chuàng)新和產(chǎn)業(yè)發(fā)展作出貢獻。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )