AI音樂創(chuàng)作、水墨畫、3D空間重建、6DoF,騰訊多媒體實驗室領(lǐng)先技術(shù)亮相數(shù)貿(mào)會

數(shù)字貿(mào)易,商通全球。近日,第二屆全球數(shù)字貿(mào)易博覽會在杭州開幕,為觀眾帶來數(shù)字貿(mào)易領(lǐng)域的新技術(shù)、新產(chǎn)品、新服務(wù)與新場景。今年,各類大模型如雨后春筍般涌現(xiàn),為解決產(chǎn)業(yè)痛點帶來了全新的思路。數(shù)貿(mào)會上,全球50個人工智能大模型集中亮相,成為最大的亮點之一。

騰訊多媒體實驗室的多項自研技術(shù)產(chǎn)品也亮相前沿趨勢館,帶領(lǐng)觀眾體驗AI作曲框架TXMusic、騰訊水墨畫、點云三維空間重建、6DoF沉浸式視頻等前沿技術(shù)產(chǎn)品,在感知技術(shù)進步中預(yù)見未來生活。

AI作曲框架XMusic由騰訊多媒體實驗室自研,曾被評為2023年世界人工智能大會“鎮(zhèn)館之寶”。XMusic支持視頻、圖片、文字、標(biāo)簽、哼唱等多模態(tài)內(nèi)容作為輸入提示詞,生成情緒、曲風(fēng)、節(jié)奏可控的高質(zhì)量音樂,大幅降低了音樂創(chuàng)作的門檻。

本次展會,XMusic團隊為現(xiàn)場觀眾帶來了最新的互動游戲。想體驗零門檻的AI音樂創(chuàng)作?想生成自己的樂器定制形象?多達(dá)12種古典和西洋樂器任你挑選,屏幕上動一動手指即可用喜歡的樂器參與AI音樂創(chuàng)作,還能和同時參與的小伙伴共創(chuàng)同一作品。線上的用戶也可以通過掃描下方小程序碼立即體驗音樂創(chuàng)作的樂趣。

“騰訊水墨畫”結(jié)合山水畫創(chuàng)作、智能作詩、智能配樂等多種自研能力,形成了多模態(tài)融合且能互動娛樂的完整解決方案,該產(chǎn)品由騰訊多媒體實驗室研發(fā),曾落地迪拜世博會,廣受好評。

基于騰訊多媒體實驗室的點云三維空間重建技術(shù),能夠快速構(gòu)建實景空間的數(shù)字孿生,即刻開啟沉浸式空間漫游與VR導(dǎo)覽。該方案已成功落地于文旅、會展等行業(yè)。比如成都世界大學(xué)生運動會,實驗室VR導(dǎo)覽方案覆蓋主場館、大運村等空間,全面提升參賽與觀賽體驗。

數(shù)字技術(shù)也不斷外溢,探索助力社會可持續(xù)發(fā)展。在文化領(lǐng)域,基于騰訊多媒體實驗室的快速點云編解碼器與渲染引擎,對甲骨文信息模型實現(xiàn)高質(zhì)量壓縮,顯著降低存儲與傳輸成本,在終端設(shè)備實現(xiàn)六自由度(6DoF)交互,全空間自由放大旋轉(zhuǎn),帶給用戶沉浸式視覺體驗,有效促進甲骨文的研究與體驗。

渲染引擎對于4K貼圖,渲染速度平均>=60fps,且支持8K超高清貼圖、PBR(基于物理的渲染)渲染方式,精細(xì)還原真實世界的材質(zhì)。使用騰訊多媒體實驗室的業(yè)界領(lǐng)先的支持最新一代視頻壓縮標(biāo)準(zhǔn)的Tencent266編解碼器,可以進一步降低傳輸帶寬的同時還能提升畫質(zhì)。

這些產(chǎn)品離不開實驗室的核心技術(shù)。新一代國際編解碼標(biāo)準(zhǔn)于20年7月正式發(fā)布,可在視頻主觀質(zhì)量不變的條件下減少50%的數(shù)據(jù)大小。騰訊多媒體實驗室正是這項標(biāo)準(zhǔn)制定的主要貢獻(xiàn)者之一,技術(shù)提案采納數(shù)量全球領(lǐng)先,實驗室專家們還在標(biāo)準(zhǔn)組織中擔(dān)任包括新一代國際編解碼標(biāo)準(zhǔn)聯(lián)合主編、參考軟件聯(lián)席主席等重要席位。

在MSU世界視頻編碼器大賽FullHD比賽中,騰訊自研最新一代視頻編碼器Tencent266取得了15項關(guān)鍵指標(biāo)中12項第一,第一總數(shù)全場最多;并在全部VVC編碼器中包攬15項指標(biāo)全部第一。此外Tencent266還在10bit/4K/主觀比賽中均取得了全場最多的第一總數(shù),證明Tencent266在不同應(yīng)用場景下均能為用戶用更低的帶寬帶來更好的畫質(zhì)。

騰訊云已于21年7月全線支持新一代國際編解碼標(biāo)準(zhǔn),這是該標(biāo)準(zhǔn)首次在云上商用,填補了全球云廠商在該領(lǐng)域的空白。Tencent266在23年初上線騰訊云直播,騰訊云成為行業(yè)首個支持VVC直播的云廠商。

騰訊多媒體實驗室代表騰訊參與多個國際及國家標(biāo)準(zhǔn)制定,包括H.266/VVC、MPEG-5 EVC、MPEG PCC、MPEG Systems、IETF、3GPP、國家標(biāo)準(zhǔn)AVS2 & AVS3、開放媒體聯(lián)盟(AOMedia) 標(biāo)準(zhǔn)AV2等,均取得了突破性成果,已有800+項技術(shù)提案被國際國家標(biāo)準(zhǔn)采納和1000+項已授權(quán)專利。實驗室專家數(shù)十人次擔(dān)任工作組/專題組聯(lián)合主席、標(biāo)準(zhǔn)聯(lián)合主編、董事等關(guān)鍵職務(wù)。同時,實驗室的研究員們在CVPR、ECCV等學(xué)術(shù)頂會和TCSVT等IEEE等專業(yè)期刊上發(fā)表了不少研究成果并獲得大量引用。

近年來,騰訊在前沿科技領(lǐng)域持續(xù)大力投入,布局以下一代互聯(lián)網(wǎng)為引領(lǐng)的數(shù)字科技,并以社會價值為牽引,讓科技在社會價值的大地上生根。

“騰訊多媒體實驗室將繼續(xù)推動多媒體及相關(guān)領(lǐng)域的國際和國家標(biāo)準(zhǔn)制定,打造音視頻、互動沉浸和智能媒體核心能力矩陣,通過騰訊云、騰訊視頻、騰訊游戲等業(yè)務(wù)平臺服務(wù)全球用戶、助力各行業(yè)發(fā)展并踐行科技向善。”騰訊云副總裁、騰訊多媒體實驗室負(fù)責(zé)人、騰訊杰出科學(xué)家劉杉博士表示。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )