騰訊“云+峰會”盛大召開 賈佳亞教授闡述計算機視覺奧秘

6月21日,由騰訊云主辦、為期兩天的2017“云+未來”峰會在深圳順利開幕。在AI大數(shù)據(jù)專場會議中,騰訊優(yōu)圖杰出科學(xué)家賈佳亞發(fā)表了主題為“計算機視覺前沿與應(yīng)用”的演講,探討和分享了計算機視覺領(lǐng)域的發(fā)展前景。這是繼他在本次主峰會分享“視覺AI技術(shù)以及社會價值”后,又一次與眾多行業(yè)大咖深度交流。

騰訊優(yōu)圖實驗室杰出科學(xué)家 賈佳亞

賈佳亞認為,新的視覺體驗、識別和視覺內(nèi)容計算是當下研究不可分割的三大方向。優(yōu)圖實驗室在專注最前沿技術(shù)研發(fā)的同時,也將把技術(shù)的能力擴展到各個領(lǐng)域,讓行業(yè)和客戶接觸和共享更有趣的技術(shù)應(yīng)用。

以下為賈佳亞教授演講的主要內(nèi)容:

        

什么是計算機視覺?計算機視覺的研究目標是使計算機程序能夠解讀和理解圖片,不僅是理解圖片的顏色,而且是更高層地理解圖片的語義及特征。人類大腦有約50%的視覺皮層,大腦分配給視覺處理的部分超過其他任何功能。計算機視覺是(AI領(lǐng)域中)最重要的研究方向之一,代表著信息的多樣性和能夠獲到的可用信息。但正所謂知易行難,計算機視覺看上去很容易,但實現(xiàn)起來卻非常困難。

       

計算機視覺主要包括三個打開方式,分別為:語義理解、識別、檢測;不受想象力約束的神奇效果(即新視覺體驗);固有需求的圖像視頻計算。

我們?nèi)绾卫斫庥嬎銠C視覺?在本屆峰會上,賈佳亞結(jié)合實際案例介紹了計算機視覺的三個打開方式。

       

第一個打開方式:語義理解、識別、檢測

國際圖像識別領(lǐng)域里最出名的比賽由斯坦福大學(xué)教授發(fā)起,名叫IMAGENET。它徹底推翻原來的競賽規(guī)則,整個數(shù)據(jù)庫里包含超過14000萬張圖像,同時有超過2萬多種類別。比賽中計算機通過100多萬張圖像訓(xùn)練來理解每張圖像屬于1000個類別中的某一個,這是一個龐大的匹配過程和檢測過程。目前,通過深度學(xué)習(xí)不斷提高識別的準確率,可以實現(xiàn)96%以上的圖像識別正確率,遠遠高過人眼識別率。

(圖像)檢測已經(jīng)逐漸成為計算機視覺研究領(lǐng)域的核心內(nèi)容和重要應(yīng)用方向。譬如,大家想象智能家居中的冰箱。當打開冰箱時,計算機可以通過算法對它進行檢測,然后告知人們冰箱里的物品種類有多少庫存。甚至如果庫存不夠,還會提醒人們?nèi)ル娚唐脚_購買回來。這些有趣的應(yīng)用,日后將通過檢測可以實現(xiàn)。

而在最新研究方向上,通過分析到更加細顆粒度的圖像識別,AI可以來推動智能駕駛、輔助駕駛、大規(guī)模城市建設(shè)的發(fā)展。尤其是在智能駕駛或者輔助駕駛環(huán)境中,顆粒度越精細越好,計算機視覺日后將在自動駕駛等新興產(chǎn)業(yè)中得到應(yīng)用。  

第二個打開方式:新視覺效果

如今的AI技術(shù)已可自動產(chǎn)生非常有趣的效果,比如能夠?qū)⒆匀粓鼍白兂摄U筆畫、水彩畫、油畫,甚至是各種抽象畫法,且已可控。以往,企業(yè)可能需要讓設(shè)計師、藝術(shù)家花較長的時間設(shè)計類似的場景。但現(xiàn)在只要接入這項技術(shù)的API或SDK,一秒鐘就能得到同樣,甚至更好的設(shè)計效果。

另一個例子,在工作中,當遇到需要畫餅狀圖的場景時,會發(fā)現(xiàn)原本在PPT里呈現(xiàn)得很好看的圖片,打印出來后卻缺失了部分顏色細節(jié)。但是,通過算法可在29毫秒內(nèi)實現(xiàn)圖片效果的優(yōu)化,以黑白的方式還原不同色彩的細節(jié)呈現(xiàn)。而這正是計算機視覺有趣的地方——永遠可以產(chǎn)生大眾想象不到的新效果。 

第三個打開方式:固有需求的圖像視頻計算

當你跟領(lǐng)導(dǎo)站在臺上拍了一張照片,或者你領(lǐng)獎時和朋友照了一張合影,結(jié)果照片較為模糊。這時候處境變得十分尷尬,因為你不可能再回到原來的場地再拍攝。此時,通過一個高級計算過程后便可將該圖做去模糊處理,讓重要的信息可以重構(gòu)出來。

另外,關(guān)于強迫透視,可以讓拍攝的圖像或背景虛化,或前景凸顯,甚至進行模糊區(qū)域的切換,把聚焦點放在別的地方。目前,一些廠商已使用這項技術(shù)來實現(xiàn)圖片后期單反效果的增強。

隨著計算機視覺的不斷發(fā)展,新的內(nèi)容會不斷出現(xiàn),計算機視覺應(yīng)用也會成為生活的基本元素。所以在未來,需要人們擔心的并不是視覺AI無法實現(xiàn)什么,而是計算機視覺將變得無所不能。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-06-23
騰訊“云+峰會”盛大召開 賈佳亞教授闡述計算機視覺奧秘
6月21日,由騰訊云主辦、為期兩天的2017“云+未來”峰會在深圳順利開幕。在AI大數(shù)據(jù)專場會議中,騰訊優(yōu)圖杰出科學(xué)家賈佳亞發(fā)表了主題為“計算機視覺前沿與應(yīng)用”的演講,探討和分享了計算機視覺領(lǐng)域的發(fā)展前景。這是繼他在本次主峰會分享“視覺AI技術(shù)以及社會價值”后,又一次與眾多行業(yè)大咖深度交流。

長按掃碼 閱讀全文