近年來,應(yīng)用場景的旺盛需求,推動AI領(lǐng)域?qū)⒓夹g(shù)能力從感知延伸到認(rèn)知、從2D擴(kuò)展到3D。
3月19日,云從科技基于單幀圖像的3D人體重建技術(shù)同時(shí)在Human3.6M、Surreal和UP-3D上創(chuàng)造了最新的世界紀(jì)錄,此次突破將原有最低誤差記錄大幅降低30%,也是繼去年云從在3D人臉數(shù)據(jù)集上大幅刷新紀(jì)錄后,再次在此類3D重建技術(shù)上取得重要成果。
Human3.6M數(shù)據(jù)集上對比
Surreal數(shù)據(jù)集上對比
UP-3D數(shù)據(jù)集上對比
3D重建領(lǐng)域通常以誤差(Error)作為衡量算法能力的主要指標(biāo),誤差(Error)就是生成模型與實(shí)際圖像的差別。一般來說,誤差(Error)越低,精度越高,意味著技術(shù)的性能越好。
云從科技3D人體重建技術(shù)全身精度誤差(Surface Error)在Surreal上從75.4毫米降低到52.7毫米,關(guān)節(jié)精度誤差(3DJointError)從55.8毫米降低到40.1毫米,Human3.6M上的關(guān)節(jié)精度誤差(3DJointError)從59.9毫米降低到46.7毫米,技術(shù)的執(zhí)行速度從之前的上百毫秒降低到僅需5毫秒。
論文中,云從科技針對人體具有豐富多樣的姿態(tài)和穿著的特點(diǎn),提出了一套全新的基于人體3D縱深預(yù)測的3D信息表征方式。通過對三原色圖像(RGB,不含深度信息)的分析,預(yù)測人體的3D形態(tài)和姿勢,并用6萬多個(gè)點(diǎn)完整描繪人體,從而在人體重建技術(shù)上取得速度與精度的雙突破,呈現(xiàn)出來的模型更精細(xì),幀率更是高達(dá)到200fps,原本由于受實(shí)時(shí)顯示限制而無法實(shí)現(xiàn)的應(yīng)用可以一一實(shí)現(xiàn)——這將極大地推動相關(guān)智能圖像應(yīng)用的落地步伐。
由于對輸入圖像的要求低,使3D重建技術(shù)將可以利用普通光學(xué)攝像頭作為感知設(shè)備。該技術(shù)將會使美顏APP無需結(jié)構(gòu)光攝像頭也能具備高精準(zhǔn)度的瘦身與動畫合成功能;商場內(nèi)試衣魔鏡將會自動根據(jù)身形生成你所想要更換的衣服,大大節(jié)省商場空間的同時(shí)提升用戶體驗(yàn)度,使更多智能應(yīng)用成為可能。
通過重要人員影像重建、醫(yī)療仿真肢體打印、虛擬試衣、美顏化妝、表情姿態(tài)動畫合成等應(yīng)用場景在大型商場、直播平臺、美顏軟件、影視特效制作等行業(yè)普惠AI能力。
值得一提的是,Human3.6M、Surreal和UP-3D是全球關(guān)于3D人體重建技術(shù)的權(quán)威數(shù)據(jù)集,加州大學(xué)伯克利分校、馬克斯-普朗克研究所、Amazon、賓夕法尼亞大學(xué)、北京大學(xué)、浙江大學(xué)、MicrosoftResearch、法國國家信息與自動化研究所、AdobeResearch等知名企業(yè)、研究所和大學(xué)都在該榜單的競爭隊(duì)列中,算法實(shí)力比拼可謂激烈,相較于以往,中國企業(yè)與高校機(jī)構(gòu)開始逐漸在國外老牌優(yōu)勢領(lǐng)域展露頭角。
與傳統(tǒng)關(guān)鍵點(diǎn)檢測、3D重建技術(shù)的區(qū)別
傳統(tǒng)的人體關(guān)鍵點(diǎn)檢測技術(shù)往往以2D的人體骨骼關(guān)節(jié)點(diǎn)檢測形式出現(xiàn),即通過技術(shù)預(yù)測RGB圖像中人體的十幾個(gè)關(guān)節(jié)點(diǎn)的坐標(biāo),一方面結(jié)果非常稀疏,將人體大為簡化成骨骼的形式,另一方面結(jié)果往往只包含二維平面上的坐標(biāo)預(yù)測,不能還原深度信息,因此無法體現(xiàn)縱深的感覺。而基于單幀圖像的3D重建技術(shù)不僅能輸出骨骼關(guān)節(jié)點(diǎn)信息,更能同時(shí)預(yù)測大量的人體表面關(guān)鍵點(diǎn)信息,預(yù)測結(jié)果更加豐富,而且每個(gè)點(diǎn)的坐標(biāo)都是3D的,能夠體現(xiàn)不同軀干的縱深信息。
3D關(guān)鍵點(diǎn)檢測
并且傳統(tǒng)3D重建技術(shù)大多需要連續(xù)的圖像序列或是多視角的圖像,在硬件設(shè)備上一般需要采用雙目攝像機(jī)或者結(jié)構(gòu)光攝像機(jī)等設(shè)備,因此在手機(jī)等便攜設(shè)備上往往難以實(shí)現(xiàn);另一方面,專用設(shè)備還會增加部署成本,增加大規(guī)模普及3D重建技術(shù)的難度。
基于單幀圖像的3D重建技術(shù)對原始圖像的需求放松的同時(shí),對背后的技術(shù)提出了更難的挑戰(zhàn):技術(shù)需要從單幀圖像中推理出人體或人臉的3D形態(tài),并通過【光學(xué)透視】【陰影疊加】等基本光學(xué)原則準(zhǔn)確預(yù)測出各個(gè)關(guān)鍵點(diǎn)在3D空間的位置和朝向,從而得到人體的姿態(tài)或表情信息。
人體姿態(tài)和服飾復(fù)雜多樣,精度提升意味著對復(fù)雜場景的適應(yīng)性更好,模型更接近真實(shí)的情況。如阿凡達(dá)、漫威電影、阿麗塔等電影中,都需要專用特效設(shè)備與面部貼點(diǎn)來完成精細(xì)的人像采集,基于單幀圖像的3D人體/人臉重建技術(shù)將徹底顛覆電影視頻的拍攝制作,同時(shí)降低工業(yè)級3D動畫合成的門檻。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 微信語音“加速播放”功能疑似上線?騰訊客服回應(yīng)引發(fā)熱議
- 英偉達(dá)引領(lǐng) AI 革命:2024 年投融百億,掀起全球科技浪潮
- 比亞迪唐L/漢L新車曝光:顛覆續(xù)航焦慮,高階智駕領(lǐng)銜,動力升級引期待
- 樊振東:凱迪拉克新寵,實(shí)力與品牌的完美結(jié)合
- 葉修跨年新加坡之旅:閱文音樂節(jié)引領(lǐng)IP新體驗(yàn)的探索
- 合資轎車降價(jià)風(fēng)暴:廣本雅閣破價(jià)12萬,車市競爭白熱化!
- 印度調(diào)查蘋果App Store支付系統(tǒng)壟斷行為,或?qū)⒐?42頁報(bào)告,呼吁開放支付系統(tǒng)
- 中國芯崛起:電動汽車行業(yè)轉(zhuǎn)向國產(chǎn)芯片
- 比亞迪逆襲上汽,終結(jié)連續(xù)18年銷冠紀(jì)錄:新能源車企崛起?
- 蘋果面臨天價(jià)和解,Siri“偷聽”集體訴訟風(fēng)波揭秘,真相究竟如何?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。