阿里“圖像搜索之父”獲ACM杰出科學(xué)家等國(guó)際大獎(jiǎng)

杭州12月23日電(趙小燕)近日,美國(guó)計(jì)算機(jī)協(xié)會(huì)(ACM)公布了2015年度杰出科學(xué)家名單,在上榜的兩位亞裔學(xué)者中,阿里巴巴圖像搜索的領(lǐng)軍 人物、阿里巴巴搜索事業(yè)部研究員華先勝位列其中。國(guó)際電氣與電子工程師協(xié)會(huì)(IEEE)也在近期公布了華先勝當(dāng)選2016年度 IEEEFellow(IEEE會(huì)士)的消息,以嘉獎(jiǎng)其“為多媒體內(nèi)容分析和圖像搜索做出的突出貢獻(xiàn)”。

兩大獎(jiǎng)項(xiàng)的背后,不僅意味著阿里圖像搜索技術(shù)已經(jīng)獲得國(guó)際最頂尖學(xué)術(shù)圈的認(rèn)同,也讓“拍立淘”這一阿里搜索“大殺器”再次獲得關(guān)注。

數(shù)據(jù)顯示,華先勝與同事們推出的“拍立淘”等王牌產(chǎn)品,正在被越來(lái)越多的手淘用戶(hù)使用和喜愛(ài):2015年雙11當(dāng)天,千萬(wàn)消費(fèi)者使用“拍立淘”購(gòu)買(mǎi)了數(shù)千萬(wàn)元的商品。

點(diǎn)擊手淘搜索框里的“相機(jī)”圖標(biāo),對(duì)準(zhǔn)喜歡的商品,或者把商品拍成相片,手淘就會(huì)自動(dòng)幫你找同款——移動(dòng)時(shí)代的這種炫酷的“以圖搜圖”,與以往的搜圖索行為大相徑庭。

“雙11”千萬(wàn)用戶(hù)拍立淘?huà)哓?/strong>

得到國(guó)際同行的高度關(guān)注和認(rèn)同,華先勝告訴表示記者,其原因在于背靠淘寶數(shù)十億級(jí)的商品圖片庫(kù),“與通用搜索不同的是,電商場(chǎng)景中,以圖搜商品是用戶(hù)的‘剛性需求’。”

無(wú)論是在雜志電視上,還是身邊街頭,看到一件心儀的商品,可能難以用文字描述,卻可以拍成照片,上傳到手淘的“拍立淘”找同款。在“拍立淘”背后默默發(fā)揮作用的,就是圖片搜索這一可視化搜索方式。

阿里巴巴集團(tuán)公布的資料顯示,2015年雙11當(dāng)天,千萬(wàn)消費(fèi)者使用了“拍立淘”功能,引導(dǎo)了超過(guò)數(shù)千萬(wàn)元的銷(xiāo)售額。而拍立淘上線(xiàn)一年以來(lái),拍 立淘所覆蓋的類(lèi)目范疇,已經(jīng)從最開(kāi)始的女裝,發(fā)展到目前的男女裝、鞋包、配飾、食品、數(shù)碼、家居、日用百貨、內(nèi)衣、瓶飲等十余個(gè)類(lèi)目。

與通用搜索主要依靠字節(jié)不同,圖像搜索被主要定義為“以圖搜圖”。據(jù)華先勝介紹,圖像搜索的第一步是訓(xùn)練計(jì)算機(jī)進(jìn)行圖像理解,也就是通過(guò)計(jì)算機(jī) 將圖片中的要素,包括人像、顏色、紋理等具體特征以及深度學(xué)習(xí)產(chǎn)生的圖像描述,轉(zhuǎn)化為類(lèi)似文字的“視覺(jué)詞”,編成索引之后,才能再進(jìn)行第二步——圖像搜 索。

從20世紀(jì)90年代開(kāi)始,國(guó)際上就開(kāi)始了對(duì)圖像搜索的研究,但直到2008年前后,計(jì)算機(jī)開(kāi)始能夠處理大量圖像,圖像搜索技術(shù)才得以突飛猛進(jìn)的發(fā)展。

2008年,還在微軟亞洲研究院工作的華先勝,就因在圖像和視頻搜索方面的嘗試,獲得了由《麻省理工學(xué)院技術(shù)評(píng)論》頒發(fā)的“全球35位35歲以下的杰出青年創(chuàng)新人物(MITTR35)獎(jiǎng)”。

評(píng)委會(huì)在頒獎(jiǎng)詞中寫(xiě)道:“有效的基于內(nèi)容的視頻搜索仍然還有很多困難沒(méi)有解決。而華先勝希望通過(guò)自動(dòng)識(shí)別圖像和視頻中物體、場(chǎng)景、事件和其他語(yǔ)義特征來(lái)攻克這個(gè)壁壘。”

但當(dāng)時(shí)能解決的,也僅僅是同圖和近似圖片的搜索,圖像搜索仍有很多未知領(lǐng)域有待探索。在華先勝看來(lái),能推動(dòng)圖像搜索下一步突破的關(guān)鍵有三點(diǎn):深 度學(xué)習(xí),大數(shù)據(jù)分析和大量用戶(hù)使用反饋。谷歌等公司雖然擅長(zhǎng)通用搜索,但圖像搜索方面缺乏“剛性”的應(yīng)用場(chǎng)景,無(wú)法積累大量真實(shí)的數(shù)據(jù)和用戶(hù)。

環(huán)顧國(guó)內(nèi)外,似乎只有阿里巴巴能夠同時(shí)具備這三個(gè)條件。

“電商平臺(tái)是圖像技術(shù)最具用戶(hù)’剛需’的應(yīng)用場(chǎng)景,特別是以圖搜圖技術(shù),目前只有電商場(chǎng)景才可以實(shí)實(shí)在在地產(chǎn)生可觀(guān)的實(shí)際價(jià)值,而從另一個(gè)角度 看,電商平臺(tái)上大量的用戶(hù)也是正是推動(dòng)圖像技術(shù)發(fā)展和應(yīng)用的基礎(chǔ)。”華先勝表示,阿里得天獨(dú)厚的平臺(tái)優(yōu)勢(shì)是吸引他從美國(guó)回來(lái),加入阿里搜索團(tuán)隊(duì)的重要原 因。

阿里圖像搜索欲彎道超車(chē)

作為行業(yè)的翹楚人物,華先勝另一項(xiàng)為業(yè)界矚目的成績(jī),就是設(shè)計(jì)并實(shí)現(xiàn)了不需要“人工標(biāo)注訓(xùn)練數(shù)據(jù)”就能產(chǎn)生識(shí)別任意目標(biāo)的圖像識(shí)別系統(tǒng)。

“之前,圖像識(shí)別需要要人工去給圖像貼標(biāo)簽(Label),讓計(jì)算機(jī)從這些數(shù)據(jù)中學(xué)習(xí)出識(shí)別模型,但我們提升了一步,訓(xùn)練計(jì)算機(jī)自己去找數(shù)據(jù), 建立自動(dòng)識(shí)別的模型。比如要識(shí)別和搜索不同種類(lèi)的花卉,不用標(biāo)注900多種花卉的圖片,而是直接輸入花卉的名稱(chēng)列表,計(jì)算機(jī)就可以自行去網(wǎng)上找數(shù)據(jù)、進(jìn)行 清洗、補(bǔ)充、學(xué)習(xí),然后就能進(jìn)行圖像識(shí)別了。”

華先勝介紹,這一技術(shù)可以適用于多種場(chǎng)景的圖像搜索,比如明星臉識(shí)別,不用輸入“范冰冰”的照片,計(jì)算機(jī)可以從網(wǎng)上自動(dòng)學(xué)習(xí)辨認(rèn)。

10月27號(hào),在澳大利亞舉行的國(guó)際頂尖多媒體學(xué)術(shù)會(huì)議ACMMultimedia2015上,華先勝代表阿里的圖像搜索團(tuán)隊(duì),向在場(chǎng)幾百名與 會(huì)專(zhuān)家分享了“拍立淘”和虛擬化妝等電商應(yīng)用,引起在場(chǎng)同行驚嘆。對(duì)此,華先勝感嘆說(shuō),“普通用戶(hù)會(huì)覺(jué)得好玩,但圈內(nèi)人會(huì)知道我們目前做的一切,包括‘拍 立淘’準(zhǔn)確度的提升多么難得,有多大的含金量。”

隨著近年來(lái)深度學(xué)習(xí)技術(shù)在圖像分析和識(shí)別領(lǐng)域的廣泛應(yīng)用,圖像的描述(特征)有了非常大的進(jìn)步,而阿里的大量商品圖像數(shù)據(jù)和用戶(hù)數(shù)據(jù),包括用戶(hù)使用反饋數(shù)據(jù)的挖掘和回流,也使得電商平臺(tái)搜索結(jié)果的相關(guān)性不斷提升,“拍立淘”的用戶(hù)UV在過(guò)去半年內(nèi)猛增了兩倍多。

比如,同樣一件外套,無(wú)論是掛在屋內(nèi)的衣架上,還是在郊外穿在模特身上,“拍立淘”都可以把它相當(dāng)準(zhǔn)確地識(shí)別出來(lái)。而從智能到更智能,阿里的團(tuán) 隊(duì)還在繼續(xù)向圖像搜索的“地心”推進(jìn),包括任意圖像的語(yǔ)義相同或相似圖的檢索,也是華先勝搜索團(tuán)隊(duì)希望下一步攻克的課題:因?yàn)橛脩?hù)在用“拍立淘”時(shí)拍什么 都有可能,可能不是商品,可能是任何物品和場(chǎng)景,如何準(zhǔn)確識(shí)別、并返回對(duì)用戶(hù)有價(jià)值的信息?

2015年底,美國(guó)計(jì)算機(jī)協(xié)會(huì)(ACM)公布了2015年度杰出科學(xué)家名單,華先勝作為僅有的兩位亞裔學(xué)者之一位列其中。ACM創(chuàng)立于1947 年,是國(guó)際上歷史最悠久、規(guī)模最大、最權(quán)威的計(jì)算機(jī)專(zhuān)業(yè)學(xué)會(huì),有“計(jì)算機(jī)界諾貝爾獎(jiǎng)”之稱(chēng)的圖靈獎(jiǎng)即由該組織評(píng)選頒布。而獲得“ACM杰出科學(xué)家”稱(chēng)號(hào) 的,必須是在計(jì)算機(jī)業(yè)界中擁有15年以上的從業(yè)經(jīng)歷并作出巨大成就和影響的研究人員。

與此同時(shí),國(guó)際電氣與電子工程師協(xié)會(huì)(IEEE)也公布了華先勝當(dāng)選為2016年度IEEEFellow(IEEE會(huì)士)的消息。IEEE是全 球最具影響力的國(guó)際學(xué)術(shù)組織之一,目前在全球160多個(gè)國(guó)家擁有超過(guò)40萬(wàn)會(huì)員。IEEEFellow是該組織授予的最高榮譽(yù),在學(xué)術(shù)科技界被認(rèn)定為權(quán)威 的榮譽(yù)和重要的職業(yè)成就,當(dāng)選人數(shù)每年不超過(guò)IEEE會(huì)員總?cè)藬?shù)的0.1%。

在被國(guó)際學(xué)界關(guān)注的同時(shí),有分析人士表示,借助圖像搜索技術(shù)的領(lǐng)先,阿里搜索也極有可能在視覺(jué)時(shí)代實(shí)現(xiàn)“彎道超車(chē)”。(完)

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2015-12-23
阿里“圖像搜索之父”獲ACM杰出科學(xué)家等國(guó)際大獎(jiǎng)
杭州12月23日電(趙小燕)近日,美國(guó)計(jì)算機(jī)協(xié)會(huì)(ACM)公布了2015年度杰出科學(xué)家名單,在上榜的兩位亞裔學(xué)者中,阿里巴巴圖像搜索的領(lǐng)軍 人物、阿里巴巴搜索事業(yè)部研究員華先勝位列其中。

長(zhǎng)按掃碼 閱讀全文