超高清視音頻技術(shù)是元宇宙的底層基礎(chǔ)技術(shù)之一,元宇宙的應用離不開超高清視音頻技術(shù)的支撐,這既給超高清視音頻技術(shù)帶來新的挑戰(zhàn),也將推動超高清視音頻技術(shù)發(fā)展進入新的階段。
2023年3月30日,由中國移動咪咕公司聯(lián)合中國移動研究院、中興通訊股份有限公司牽頭,共24家單位共計61位專家參與編制的世界超高清視頻產(chǎn)業(yè)聯(lián)盟(UWA聯(lián)盟)《元宇宙時代超高清視音頻技術(shù)白皮書》在第十屆中國網(wǎng)絡(luò)視聽大會上發(fā)布。UWA聯(lián)盟秘書長張文剛在會上對白皮書進行了解讀。
元宇宙的時代背景
元宇宙作為信息技術(shù)革命的未來圖景,是網(wǎng)絡(luò)強國和數(shù)字中國拼圖的重要板塊,也必然是實現(xiàn)中國式現(xiàn)代化,推動構(gòu)建人類命運共同體,創(chuàng)造人類文明新形態(tài)的物質(zhì)基礎(chǔ)。元宇宙是技術(shù)聚合體、產(chǎn)業(yè)聚合體和生態(tài)聚合體,其背后是實實在在的技術(shù)集群、產(chǎn)業(yè)集群和用戶需求。
元宇宙將觸發(fā)超高清視音頻用戶體驗增量躍遷與技術(shù)產(chǎn)業(yè)持續(xù)演進。當前大眾對美好生活的進階需求對數(shù)字內(nèi)容的體驗方式提出了新要求,分辨率、高動態(tài)范圍等視聽質(zhì)量維度的常規(guī)迭代難以帶來用戶體驗的增量躍升。在元宇宙概念下,超高清數(shù)字內(nèi)容既需要做到讓大眾有明顯感知,又能引領(lǐng)生活方式變革與產(chǎn)業(yè)結(jié)構(gòu)創(chuàng)新,現(xiàn)實時空與數(shù)字時空不再彼此分割,在虛實融合的互聯(lián)時空下,未來超高清視音頻生態(tài)的構(gòu)建有賴于傳統(tǒng)視音頻向沉浸式、交互性與多維化方向發(fā)展演進。
元宇宙時代超高清視音頻技術(shù)新需求
從零售、泛娛樂、文旅游戲、社交、教育、政務、工業(yè)等元宇宙典型場景入手分析,為滿足視覺、聽覺以及觸覺方面的體驗要求,對超高清視音頻技術(shù)在沉浸式視聽體驗、實時多維互動、高效內(nèi)容生產(chǎn)和用戶大規(guī)模在線等四個方面都有新的需求:
一、沉浸式視聽體驗:傳統(tǒng)二維視音頻升級勢在必行。從內(nèi)容生產(chǎn)、高效編碼,到沉浸式影像的傳輸與呈現(xiàn)等方面技術(shù)演進,實現(xiàn)虛擬與現(xiàn)實融合的沉浸式體驗;
二、實時多維互動:元宇宙還需要強交互,這對交互的自由度、實時性及多模態(tài)等方面提出了更高的要求;
三、高效內(nèi)容生產(chǎn):元宇宙時空構(gòu)建,需要大量的內(nèi)容,這就需要提升現(xiàn)有的內(nèi)容生產(chǎn)效率。
實時及大規(guī)模用戶名在線:元宇宙的場景中大規(guī)模的用戶可同時在線并進行實時互動,這對視音頻的處理、通信、呈現(xiàn)等實時性、兼容性有較高的要求。
未來超高清視音頻生態(tài)的構(gòu)建有賴于傳統(tǒng)視音頻向沉浸式、交互性與多維化的方向發(fā)展演進。
元宇宙時代超高清視音頻核心關(guān)鍵技術(shù)
視音頻技術(shù)是元宇宙產(chǎn)業(yè)應用的基石,其發(fā)展需要在單點技術(shù)的發(fā)展基礎(chǔ)上,融合多種關(guān)聯(lián)技術(shù),形成針對橫向技術(shù)棧的端到端解決方案,實現(xiàn)元宇宙時代視音頻技術(shù)的有效連接和共同發(fā)展。白皮書給出了面向元宇宙時代的超高清視音頻技術(shù)體系,基于元宇宙時代的技術(shù)需求面向超高清的端到端流程,詳細分析了包括內(nèi)容生成、內(nèi)容編碼、網(wǎng)絡(luò)傳輸、內(nèi)容解碼、交互與呈現(xiàn)、用戶體驗及版權(quán)保護各個模塊面向元宇宙時代關(guān)鍵技術(shù)升級和前沿研究。以內(nèi)容生成為例,其中內(nèi)容采集環(huán)節(jié)涵蓋了最先進的面向元宇宙場景的數(shù)字人、場地、三維聲等采集技術(shù);內(nèi)容制作環(huán)節(jié)則包括了具有三維立體和實時交互的特性視音頻內(nèi)容制作,例如支持6Dof交互的如點云視頻制作、光場視頻制作等前沿技術(shù);模型制作,包括3D人和物的建模、模型驅(qū)動、實時渲染等,都是面向元宇宙時代的新技術(shù)發(fā)展方向。研究探討視音頻關(guān)鍵技術(shù)簇,對于提升元宇宙的視聽體驗,具有重要的技術(shù)支撐作用。
元宇宙時代超高清視音頻技術(shù)標準體系
元宇宙時代視音頻技術(shù)涉及非常豐富的業(yè)務應用場景,視音頻技術(shù)作為元宇宙的基礎(chǔ)技術(shù),不同的場景有視音頻相關(guān)的新技術(shù)需求。根據(jù)本白皮書中分析的元宇宙時代超高清視音頻技術(shù)現(xiàn)狀及發(fā)展趨勢,從視音頻采集、制作、傳輸、呈現(xiàn)、應用等各環(huán)節(jié)分析當前國內(nèi)外的標準化現(xiàn)狀,提取出標準化需求,針對包括基礎(chǔ)通用、內(nèi)容生成、媒體傳輸與處理、交互呈現(xiàn)、行業(yè)應用五個方面,給出了元宇宙時代超高清視音頻技術(shù)體系框架和標準化建議,為未來的標準化工作指引方向。
元宇宙的本質(zhì)是建構(gòu)原生于物理時空且與之交融的數(shù)字時空,時空的構(gòu)建離不開超高清視音頻技術(shù)的進一步發(fā)展?!对钪鏁r代超高清視音頻技術(shù)白皮書》是超高清視音頻領(lǐng)域面向元宇宙時代的首個技術(shù)白皮書,旨在探索超高清視音頻技術(shù)的元宇宙發(fā)展方向,從面向元宇宙場景的超高清視音頻技術(shù)需求出發(fā),分析了元宇宙時代端到端超高清視音頻相關(guān)的關(guān)鍵技術(shù)及發(fā)展趨勢,并針對元宇宙下的超高清視音頻技術(shù)提出了標準化體系建議,這將推動超高清視音頻產(chǎn)業(yè)更好更快的發(fā)展,助力數(shù)字經(jīng)濟蓬勃發(fā)展。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 生成式AI:CEO必讀指南
- 麻省理工科技評論:新興的工業(yè)元宇宙報告
- 中國信通院:數(shù)據(jù)資產(chǎn)運營能力成熟度模型
- 半導體:趨勢、周期和供應鏈安全
- 中國電信研究院:2023中國數(shù)字家庭競爭力指數(shù)白皮書
- 羅蘭貝格:自動駕駛出租車(ROBOTAXI)商業(yè)化前景展望
- 艾瑞咨詢:ChatGPT浪潮下,看中國大語言模型產(chǎn)業(yè)發(fā)展
- 清華大學:2023年AIGC發(fā)展研究報告1.0版
- ?UWA聯(lián)盟:2023年元宇宙時代超高清視音頻技術(shù)白皮書
- 元宇宙2023:硬件的“大”年
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。