3月2日,阿里巴巴與清華大學聯合發(fā)布業(yè)界最大的中文多模態(tài)預訓練AI模型M6,該模型參數規(guī)模超千億,同時具備文本、圖像的理解和生成能力,圖像設計效率超越人類,可應用于產品設計、信息檢索、機器人對話、文學創(chuàng)作等領域。
阿里M6模型根據文本內容,自動設計特定風格圖片
預訓練語言模型是讓AI具備認知能力的關鍵技術,它突破了傳統深度學習方法的瓶頸,是一種新型AI訓練思路,即首先自動學習大量語言文字和圖像數據,記憶和理解人類豐富的先驗知識,再進一步學習專業(yè)領域信息,從而讓AI同時掌握常識和專業(yè)知識。目前,谷歌、微軟和 Facebook等企業(yè)已投入該技術的研發(fā)。
此次發(fā)布的M6模型參數規(guī)模達到1000億,是多模態(tài)預訓練領域史上最大的模型,其理解和生成能力超越傳統AI。以圖像生成為例,模型可設計包括服飾、鞋類、家具、首飾、書籍等在內的30多個物品類別的圖像,最短一分鐘即可完成作品的創(chuàng)作,效率超越普通設計師。
阿里M6模型自動生成相關圖像效果
M6的突破源自多項底層技術創(chuàng)新。阿里巴巴研究團隊基于自研Whale分布式框架,將參數規(guī)模擴展到千億的同時,利用大規(guī)模數據并行和模型并行,訓練速度提升10倍以上,僅需1-2天即可完成上億數據的預訓練。此外,M6模型首次將多模態(tài)預訓練模型應用到基于文本的圖像生成任務,結合向量量化生成對抗網絡學習文本與圖像編碼共同建模的任務,能夠生成清晰度高且細節(jié)豐富的圖像。
阿里巴巴達摩院智能計算實驗室資深算法專家楊紅霞表示:“多模態(tài)預訓練是下一代人工智能的基礎,M6模型實現了訓練效率和生成精度等多項突破,是當前眾多中文多模態(tài)下游任務最優(yōu)模型?!?p>
作為國內最早投入認知智能研究的科技公司之一,阿里巴巴已有30多項認知智能領域研究成果被國際頂級會議收錄;據介紹,研究團隊還將研發(fā)更高規(guī)模的萬億參數多模態(tài)預訓練模型,進一步突破算力及預訓練模型的極限,最終實現通用領域的高質量泛內容生成。(來源:獵云網)
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長:總收入70.2億元,付費用戶數1.19億
- 蘋果Q4營收949億美元同比增6%,在華營收微降
- 三星電子Q3營收79萬億韓元,營業(yè)利潤受一次性成本影響下滑
- 賽力斯已向華為支付23億,購買引望10%股權
- 格力電器三季度營收同比降超15%,凈利潤逆勢增長
- 合合信息2024年前三季度業(yè)績穩(wěn)?。籂I收增長超21%,凈利潤增長超11%
- 臺積電四季度營收有望再攀高峰,預計超260億美元刷新紀錄
- 韓國三星電子決定退出LED業(yè)務,市值蒸發(fā)超4600億元
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。