美圖CTO張偉:5年前 不會想到會花 70%時間在AI上

視覺文化時代,「顏值」作為生活之美的展示,被覽閱和品味,不僅成為一種文化符號,更成為一種可以被消費和增值的商品。

美圖做的就是「顏值」這門生意。

在國內,或許沒有哪家公司能比美圖更能精準把握人們對于「顏值」的需求。單是圍繞這一點,美圖就分步有序地打造了 20 多個美顏類 app,以及為自拍功能定制的手機。在初期一片唱衰和嘲諷中,手機已然成為美圖營收主要的貢獻者,2016 年近 75 萬臺的銷量,為美圖提供了 14.7 億的收入。

如果你走在商業(yè)街里,推開一家家私營服裝店,會發(fā)現(xiàn)這些店主們十有八九,用的都是美圖標志性的盾牌形狀手機。

新花樣:視頻實時分割

「美」總是需要新花樣的。膚白長腿大眼遠遠不夠,還更需要有趣的內容和形式。而這種「花樣」需要繁復的基礎技術作為支撐。

對于目前最火熱的人工智能技術,美圖自然也看到了它背后蘊含的顛覆性力量。

在美拍平臺上,明星柳巖所拍攝的美少女變身視頻,已經(jīng)擁有接近 200 萬的播放量,里面所展現(xiàn)的「百變背景」功能,可以在視頻中進行實時圖像分割,將人物從真實場景中摳出,放置在特定的卡通背景中,并加入 AR 特效和音樂效果。

專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時間在人工智能上

這項技術的實現(xiàn),用了深度學習。

在 CV 圈,圖像分割技術并不新鮮。對于一張靜態(tài)的圖片進行分割,可以花費很長時間來處理,但是「實時」則要求達到每秒 30 幀的處理速度。在這極短的時間內需要進行的工作包括:人像識別和分割、邊緣處理、背景替換、實時美顏美型、AR 效果添加等多個環(huán)節(jié)。

保證視頻實時分割的響應性、速度和可靠性,綜合考驗了一家公司技術團隊的研發(fā)和工程能力。

AI 領域的發(fā)聲

作為一家 2C 的產(chǎn)品公司,美圖一直以來營造的是一個接地氣的親和品牌形象,隨著科技感更強的手機品牌的推出,美圖也逐漸在人工智能領域尋找更強的存在感。在「百變背景」正式推出之前,美圖就把相關 Demo 搬到了學術大會 VALSE(視覺與學習青年學者研討會)上。

這場四月中旬召開的學術會議,參會者達 2500 多人,聚攏了國內頂尖 AI 公司代表和計算機視覺青年研究人才。

在 VALSE 用于展示論文 Poster 墻的附近,就是 Demo 區(qū),排列著國內大大小小的計算機視覺公司展臺,包括 BAT、曠視科技、格靈深瞳、云從科技、滴滴出行等。與其它 AI 公司展臺動輒「識別率」和人臉比對系統(tǒng)坐鎮(zhèn)的高冷范兒相比,美圖展臺的 Demo 產(chǎn)品更易令人產(chǎn)生參與的欲望,試玩的人自然絡繹不絕,內行走過,也會不禁念叨一句「喲,他們家產(chǎn)品挺有意思」。

專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時間在人工智能上

(VALSE 現(xiàn)場圖)

不可否認,美圖的產(chǎn)品招人喜歡。

美圖在人工智能領域并不算喊得很大聲的那一個,但是動作下得很早。

2010 年,美圖成立了一個專注于前沿影像技術研發(fā)的實驗室:MTLAB(美圖影像實驗室)。這次推出的「百變背景」功能,就出于 MTLAB 之手。

MTLAB 地理上分布在北京、廈門和深圳,北京注重于長期、基礎性技術研究,廈門 MTLAB 側重 AI 應用落地,深圳則偏重于硬件產(chǎn)品的算法支持。這個實驗室早在 2012 年的時候就關注了深度學習技術。美圖 CTO 張偉在接受雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))采訪時,介紹道:

「大概在 2011、12 年就開始加入人工智能部分的研發(fā)了。原因是,這東西一開始看起來是萬能的,當然后面發(fā)現(xiàn)有很多問題?!?/p>

專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時間在人工智能上

(美圖 CTO 張偉)

雖然不同地區(qū)實驗室側重點不同,但是為了確保研發(fā)和產(chǎn)品的無縫銜接,往往會把同一個項目的研發(fā)人員,分在北京、廈門和深圳三地。其他部門的員工,大約每兩周都要與實驗室的同事碰頭,產(chǎn)品經(jīng)理分享新的 app 資訊,實驗室同事分享新的 paper 和技術趨勢。

實際上,一個新的產(chǎn)品功能,都是在研發(fā)和產(chǎn)品團隊反復「磋商」的氛圍中誕生的。

「我們基本上是一個研發(fā)小組先做 demo,demo 不錯的話,交給一個中間架構團隊把它封裝成一個組件,交給前端。然后在公司里面去問,哪個產(chǎn)品團隊對這個新技術感興趣?有團隊感興趣的話,產(chǎn)品團隊里的設計師們,就會拿過去做二次開發(fā),然后再對這個組件提一些性能、速度、效果方面的建議?!?/p>

談及美圖來這次 VALSE 大會的緣由,張偉經(jīng)常提到一個詞匯就是「看到」。美圖雖然是年資較長的上市公司,在人工智能領域投入也不菲,但 AI 這個標簽并不是其與生俱來的。就算是在人工智能領域重度參與的英偉達,其 CEO 黃仁勛還在最近的采訪中表示「將來某一天,我們可能會成為一家人工智能計算公司」。這是向 AI 轉型的公司都要共同面臨的課題,要反復向外界強調自己在 AI 領域的存在。所以美圖需要參加 AI 圈的活動,不論學術的還是業(yè)界活動:

「因為我們畢竟在做 AI 這個領域,我們希望大家看到我們,我們也看到他們?!?/p>

如果不做人工智能,美圖就會空掉

人工智能對于美圖公司來說,到底處在一個什么樣的位置?作為 CTO 的張偉一句話說明了一切:

我花 70% 的時間在上面...... 我們覺得如果再過三年,這家公司不做 AI,可能就會空掉了。

美圖從一家工具型公司,往人工智能公司轉型,不僅僅是出于產(chǎn)品需求,更是攸關性命的一項抉擇。在他看來,人工智能這項技術,可以把美圖已有的東西重新刷一遍,將技術水平提升到一個前所未有的高度。

「很多人工智能創(chuàng)業(yè)公司有個問題,就是『為人工智能而人工智能』,這不是一個合理的東西。但我們就是有一個很明確的目標,比如女性變美這件事情,這件事情很垂直,深度學習能做嗎?一定能做!大數(shù)據(jù)能不能起到作用,一定能起作用!」

李開復曾經(jīng)盛贊美圖是一家「頂級人工智能公司」。對此,張偉本身的用詞會更加謹慎:

「開復老師這么說,是對我們一個非常高的肯定。如果你去看開復老師對于人工智能的定義,是包含兩個方面,就是機器學習+大數(shù)據(jù)。那至少另外一半我們是有的。剩下的機器學習,我個人認為,深度學習相關的東西,美圖已經(jīng)涉及的足夠深了?!?/p>

眾所周知,美圖坐擁人臉和圖像數(shù)據(jù)巨礦,剩下的,就是對挖礦工具的深度打磨。張偉認可人工智能技術的巨大價值:

「整個世界都在等煉油的技術,數(shù)據(jù)就像石油一樣,如果沒有煉油的工具,石油就是一團黑水。但只要你有了煉油的工具,只要能挖到石油,那就跟印鈔機一樣?!?/p>

但同時,他是一個堅定的「非技術決定論者」,他認為一項 AI 技術的成功應用,還涉及到產(chǎn)品、設計、商業(yè)等各種因素。

雖然美圖拿手的是人臉技術,但是出于對電商和廣告抱持的野心,美圖研發(fā)團隊的人員同樣投入大量精力在其他物體的識別技術上。

「我們內部做人臉的人數(shù),跟做其它物體識別人數(shù),比例為 1:7?!?/p>

沒有對手,有什么意思?

美圖的產(chǎn)品,并非沒有對手。例如打頭陣的美圖秀秀 app,市面上就有很多類似的競爭對手,而且有的是來自于 BAT 級別的公司,美圖當然有危機感,但對此張偉用了一個很性情的詞兒--「酷」。

「我們有很強的危機感,但這實際上是一件很酷的事情。沒有對手,有什么意思?我們也知道一些競爭對手的相關團隊有挺多人,我們投入很大的精力和資金去追趕,但是當證明完自己之后,我們在想一個問題,就算你比其它公司多出 0.1%、0.2% 個點,還是遠遠不夠的?!?/p>

歸根結底,還是一個老觀點,技術并不是唯一決勝的關鍵,美圖的「顏值」生態(tài)鏈,包括龐大垂直的用戶群、對用戶需求的精準把控、品牌效應和商業(yè)模式構成了一個完整的鏈條,這是其核心競爭力。

「我們每一個產(chǎn)品都有一個競爭對手,但是合在一起,我們覺得沒有像我們一樣的綜合體。我們的看法是,如果我們再把技術往深的地方做,一定會把別人拉開一大段距離。但即便拉不開大距離,以我們目前產(chǎn)品、運營、品牌的綜合實力,我們不會覺得有多大問題。因為不只是比技術。」

所以,在 AI 技術方面,美圖并不忌諱借用外力。甚至為了更快取得先機,會主動尋求與更多第三方合作機會。而美圖這次參加 VALSE 大會,其實也是為了跟 AI 業(yè)界同仁進行一次深度的交流,談一談可能的合作。

「美圖不然自己做,不然就靠第三方的資源建立起來,構建自己獨一無二的生態(tài)系統(tǒng)...... 我們正在跟世界上很多不同的團隊,一起來做深度學習的工作,互相學習和交流,而我們也在做學術方面的工作?!?/p>

談及如今 AI 公司幾乎標配的「首席科學家」,張偉也是保持著開放的態(tài)度。

「每個公司邀請首席科學家的目的不同,可能是為了更好的融資,也可能是為了讓公司的技術水平進一步提升。對于美圖而言,如果一位科學家的加入能給我們的研發(fā)水準帶到一個新的高度,我們也很愿意敞開懷抱去迎接他的到來。」

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2017-05-12
美圖CTO張偉:5年前 不會想到會花 70%時間在AI上
視覺文化時代,「顏值」作為生活之美的展示,被覽閱和品味,不僅成為一種文化符號,更成為一種可以被消費和增值的商品。

長按掃碼 閱讀全文