盤古大模型賦能華為云MetaStudio數字內容生產線,構建有“溫度和情感”的企業(yè)應用

今天,華為開發(fā)者大會(Cloud)在東莞盛大開幕。華為云媒體服務產品部部長呂陽明在大會主題演講中帶來盤古基礎大模型賦能的MetaStudio數字內容生產線,也是華為云MetaStudio的全新升級。通過提供模型生成和模型驅動兩大服務,快速生成和驅動數字人模型,賦能在線教育、文娛直播、企業(yè)會議等行業(yè)應用,從“0101的比特傳輸”走向“有溫度的模型交互”,改變傳統(tǒng)交互方式,重塑內容生產。并通過現場展示數字人阿拉伯演講視頻生成和數字人云會議實時驅動引爆全場。

在數字內容產業(yè),內容力決定了企業(yè)的競爭力。當前,AI生成內容(AIGC)正在重構數字內容生產模式,重新定義內容力。企業(yè)在內容生產上用到的算力核數、模型參數量和行業(yè)知識數,決定了企業(yè)在內容生產上的競爭力,因此,知識力(模型的深度)決定了內容力。

華為云基于盤古基礎大模型,賦能MetaStudio數字內容生產線,打造了盤古數字人大模型,實現MetaStudio數字內容生產線全新升級,通過提供模型生成和模型驅動兩大服務,讓每個人實現數字人自由,幫助企業(yè)構筑更強的內容力。

數字人模型生成服務

基于盤古基礎大模型,MetaStudio使用了PB級的音視頻數據進行訓練,構建了數字人通用大模型,包括數字人形象、動作、表情、口型、聲音等;每個用戶可以基于數字人通用大模型,再結合個人數據進行訓練,構建用戶自己的數字人個性化大模型。

數字人模型生成服務,可以通過文字、圖片、視頻等多種模式來生成數字人。

·文本生成數字人:通過輸入文本,描述希望生成數字人的樣子,10秒即可生成模型;

·圖片生成數字人:通過上傳一張照片,根據照片中的個人特征,生成不同類型的數字人,比如風格化數字人、美型數字人,模型生成時間僅需30秒;

·視頻生成數字人:只需要拍攝一段5分鐘的視頻,就可以生成數字人個性化大模型,包含用戶自己的表情、口型、動作特征,整個模型訓練過程只需要1個小時。而業(yè)界一般需要訓練12個小時以上。

數字人模型驅動服務

數字人大模型可以使用多種方式進行驅動,包括文字、語音、視頻等,通過驅動向量信息來驅動數字人,生成高清視頻。

·文字驅動:基于識別文字的語義和情感,實現數字人動作和文字的精準匹配;

·語音驅動:通過多語言泛化技術,一種語言、一次訓練,即可使用多種語言驅動數字人;

·視頻驅動:現在業(yè)界大部分數字人都是站在固定點講解,無法支持移動,華為云通過2D視頻,以及2D/3D數據的聯合訓練,實現數字人走動、側身、手勢的精確驅動。

華為云MetaStudio數字內容生產線,基于盤古大模型、渲染引擎和實時音視頻能力,提供數字人模型生成服務和模型驅動服務,聯合伙伴和開發(fā)者,共同構建有“溫度和情感”的企業(yè)應用。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )