AIDQg56+H6K665paH5YWl6YCJIElDQ1YgMjAxOe+8jOWJjeayv+Wtpuacr+aIkOaenOi1i+iDvembtuWUrg=="/>
2019 年 10 月 27 日-11 月 2 日,全球計算機(jī)視覺頂級會議之一 ICCV(IEEE International Conference on Computer Vision,國際計算機(jī)視覺大會)在韓國首爾順利舉行,7500 余位來自 59 個國家的計算機(jī)視覺學(xué)者齊聚現(xiàn)場,共享盛會。今年的會議不論是在參會人數(shù)還是論文提交數(shù)量,相較去年都足足增加了一倍。此外,根據(jù)官方數(shù)據(jù)顯示,在大會接收論文中,此次中國學(xué)者的研究成果數(shù)量排名第一,遙遙領(lǐng)先。
專注于計算機(jī)視覺技術(shù)研發(fā)與落地的碼隆科技今年共有 4 篇第一單位論文入選,研究方向涵蓋弱監(jiān)督學(xué)習(xí)算法、文字檢測與識別模型及服裝圖像生成框架的搭建等細(xì)分領(lǐng)域,包括:
Label-PEnet: Sequential Label Propagation and Enhancement Networks for Weakly Supervised Instance Segmentation
Convolutional Character Networks
FiNet: Compatible and Diverse Fashion Image Inpainting (Oral)
ClothFlow: A Flow-Based Model for Clothed Person Generation
并憑借“The iMaterialist Fashion Attribute Dataset”研究成果獲得了“Computer Vision for Fashion, Art and Design”主題分會(workshop)頒發(fā)的最佳論文。
探索邊界,學(xué)術(shù)成果獲肯定
ICCV 2019 共有 1075 篇論文被接收,一向以接收率低而著稱的它,此次接收率也僅為25%,其中口頭報告論文更是僅有4.6%。碼隆科技此行收獲頗豐,其作為第一單位共有4篇論文被接收,其中包含一篇口頭報告論文。
1
10 月 31 日,碼隆科技在備受關(guān)注的主會場(Main Conference)分享了 ICCV 2019 口頭報告論文“FiNet: Compatible and Diverse Fashion Image Inpainting”的研究內(nèi)容。
AIDQg56+H6K665paH5YWl6YCJIElDQ1YgMjAxOe+8jOWJjeayv+Wtpuacr+aIkOaenOi1i+iDvembtuWUrg=="/>
近年來,專注于時尚分析的計算機(jī)視覺研究發(fā)展快速,其中視覺上的兼容與協(xié)調(diào)對其尤為重要,然而現(xiàn)有的時尚圖像生成系統(tǒng)在此方面卻仍然有所欠缺。碼隆科技在 ICCV 2019 口頭報告論文中指出可通過時尚圖像修復(fù)來對視覺上的搭配兼容性進(jìn)行顯式的建模,并提出了 Fashion Inpainting Networks(FiNet,時尚圖像補全網(wǎng)絡(luò))。這是一個兩階段的圖像到圖像生成框架,能夠?qū)崿F(xiàn)視覺上兼容協(xié)調(diào)但不失多樣化的圖像修復(fù)技術(shù),這一研究可為服裝重建和時尚風(fēng)格遷移等相關(guān)任務(wù)提供有力的工具。
AIDQg56+H6K665paH5YWl6YCJIElDQ1YgMjAxOe+8jOWJjeayv+Wtpuacr+aIkOaenOi1i+iDvembtuWUrg=="/>
2
11 月 1 日,碼隆科技專注于服飾生成算法的研究“ClothFlow: A Flow-Based Model for Clothed Person Generation”在 Poster 環(huán)節(jié)進(jìn)行了展示。
在該學(xué)術(shù)工作中,碼隆科技提出了一種基于外觀流的生成模型 —— ClothFlow,這一模型能夠合成特定姿態(tài)的人物服裝圖像,以用于基于姿態(tài)引導(dǎo)的人物圖像生成和虛擬試衣。通過估計源服裝區(qū)域和目標(biāo)服裝區(qū)域之間的稠密流場,ClothFlow 模型能夠有效地針對幾何形變進(jìn)行建模,并自然地進(jìn)行外觀遷移以合成與眾不同的服裝圖像,如下圖所示。
3
近年來,弱監(jiān)督學(xué)習(xí)越來越受到學(xué)界和業(yè)界的關(guān)注。10 月 30 日,碼隆科技專注于弱監(jiān)督學(xué)習(xí)算法的論文“Label-PEnet: Sequential Label Propagation and Enhancement Networks for Weakly Supervised Instance Segmentation” 向參會者展示了與其日常工作緊密相關(guān)的算法研究。
這一研究致力于在僅僅給定圖像級別標(biāo)簽的情況下精確地檢測與分割物體實例。因為手工標(biāo)注大量訓(xùn)練數(shù)據(jù)代價高昂,與監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)等方式相比,它是更適用于現(xiàn)實應(yīng)用的技術(shù)。與以前那些包含多個離線模塊的方法不同的是,本篇論文提出了序列化標(biāo)簽傳播與增強網(wǎng)絡(luò)(縮寫為 Label-PEnet)。Label-PEnet 基于一種由粗到細(xì)的方式,可以遞進(jìn)地將圖像級別的標(biāo)簽轉(zhuǎn)化成像素級標(biāo)簽,極大程度地提升了圖像數(shù)據(jù)在工業(yè)場景中的應(yīng)用效率。
4
自然場景下的文字檢測與識別是近年來的熱點研究方向之一,但相較于技術(shù)已經(jīng)相對成熟的打印文檔文字識別,自然場景中的文本識別仍具困難,比如文字的呈現(xiàn)可以有多種方向、多樣的顏色和字體等,這些情況都為文字檢測與識別技術(shù)在現(xiàn)實生活中的應(yīng)用帶來了挑戰(zhàn)。
11 月 1 日,主題為“Convolutional Character Networks”的論文在 Poster 展示環(huán)節(jié)中詳盡地呈現(xiàn)了碼隆科技在 ICCV 2019 上提出的一種單階段模型——卷積字符網(wǎng)絡(luò) - CharNet (Convolutional Character Networks)。CharNet 第一次實現(xiàn) one-stage 模型的文字檢測和識別。
此外,11 月 2 日,碼隆科技還受邀參加了“Computer Vision for Fashion, Art and Design ”主題分會(workshop)。此前,碼隆科技與 GoogleAI 聯(lián)合發(fā)布了 iFashion 數(shù)據(jù)庫,其相關(guān)研究“The iMaterialist Fashion Attribute Dataset”本次也斬獲了該場 workshop 最佳論文的榮譽。
暢聊AI,技術(shù)落地進(jìn)展獲關(guān)注
作為 ICCV 2019 的黃金贊助商,碼隆科技在展會期間展示了 RetailAI 系列智能零售解決方案,如智能貨柜解決方案、資產(chǎn)保護(hù)解決方案、智能稱重解決方案等,進(jìn)一步與參會者分享了前沿技術(shù)在工業(yè)界的扎實應(yīng)用,獲得了大家的廣泛關(guān)注。
展會現(xiàn)場,碼隆科技成員們與眾多計算機(jī)視覺學(xué)者就其研究方向與落地進(jìn)展進(jìn)行了深入交流。同時,在會議期間,眾學(xué)者前往碼隆展臺就其關(guān)于弱監(jiān)督學(xué)習(xí)算法、文字檢測與識別模型、服裝圖像生成框架的研究工作進(jìn)行探討。
眾多計算機(jī)視覺研究者前來碼隆科技展位交流技術(shù)進(jìn)展
結(jié)語
自2014年創(chuàng)立以來,碼隆科技持續(xù)專注于計算機(jī)視覺技術(shù)在商品識別領(lǐng)域的研發(fā)與落地應(yīng)用。至今,碼隆科技在計算機(jī)視覺領(lǐng)域的頂級會議 ICCV、CVPR、ECCV上發(fā)表了十余篇學(xué)術(shù)論文,引起了眾多知名學(xué)者的關(guān)注。未來,碼隆科技將繼續(xù)攜手學(xué)術(shù)界,努力拓展技術(shù)邊界,并與工業(yè)界一同致力于推進(jìn)前沿技術(shù)在真實世界的應(yīng)用與落地,全方位實現(xiàn) AI 前沿技術(shù)的創(chuàng)新價值。
- 特斯拉銷量下滑,iPhone 17系列將搭載新型均熱板:科技巨頭如何應(yīng)對發(fā)熱難題?
- 火線救援:歐美創(chuàng)新企業(yè)聯(lián)手研發(fā)滅火無人機(jī),直面加州山火挑戰(zhàn)
- 新能源車銷量破億,十年領(lǐng)跑全球:中國新能源車市場新篇章
- 美國多州立法限制學(xué)生在校使用手機(jī):教育與科技的平衡挑戰(zhàn)
- 三星折疊手機(jī)新突破:首款三折疊手機(jī)2025Q2量產(chǎn),預(yù)計年產(chǎn)量僅20萬臺
- 冬季寒冷,暖心又暖身的產(chǎn)品需求大增:尼爾森IQ揭示“暖+”品類增長超3倍,即時零售平臺活力更勝全渠道
- 特斯拉新Model Y火爆上市:訂單破紀(jì)錄,新能源車市場再掀風(fēng)潮
- 蘋果緊急修復(fù)macOS漏洞:黑客可利用安裝惡意內(nèi)核驅(qū)動,用戶需警惕
- 微軟逆勢擴(kuò)張:裁員潮中獨善其身,AI投資再加大
- 華為鴻蒙生態(tài)再提速,長城汽車轉(zhuǎn)型自信汽車,未來可期
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。