落地,是2019年AI行業(yè)的共同話題,創(chuàng)造價值、降本增效,成為行業(yè)共識。
作為AI頭雁公司、也即將成為AI創(chuàng)業(yè)第一股的曠視,又是怎樣看待落地這個話題的?
而作為一位技術(shù)領袖,曠視聯(lián)合創(chuàng)始人兼CTO唐文斌,又認為當下環(huán)境下有哪些技術(shù)創(chuàng)新的機會?
AI
在MEET2020智能未來大會現(xiàn)場,作為在行業(yè)中摸爬滾打八年的實踐者,唐文斌用四個字解答了人工智能落地的議題——價值創(chuàng)造。
要點
1、 AI落地必須回答產(chǎn)品經(jīng)理靈魂拷問:你到底給誰創(chuàng)造了什么樣的價值?
2、 AI的價值主要體現(xiàn)在三個方面:成本優(yōu)化、效率提升、體驗增強。
3、 AI在不同行業(yè)發(fā)展的速度不一樣,有難有易,更容易發(fā)展起來的,是那些給予AI試錯機會的場景。
4、 AIoT 是人工智能技術(shù)與產(chǎn)業(yè)深度結(jié)合的必經(jīng)之路,因為硬件成本逐漸變得更低,5G讓連接變得更迅捷,在這些基礎之上實現(xiàn)非常好的IoT的連接后,就能夠產(chǎn)生更多數(shù)據(jù),讓AI算法實現(xiàn)快速突破。
5、 AIoT在體系下有且僅有三種角色,分別是感知器、決策器、執(zhí)行器,每個部分都有創(chuàng)新機會。
唐文斌演講分享全文
謝謝大家!謝謝主持人對我們的介紹,其實AI公司做的事情并非光鮮亮麗,反而非常的實際、非常的累,所以今天我想講點接地氣的事情。
現(xiàn)在很多人都在講AI,我們也可以看到AI技術(shù)確實給不同場景帶來了很多應用,機器學習、深度學習都給計算機視覺、語音識別,NLP等一系列的技術(shù)提供了好的手段,使其性能有大幅度的增長。
因此,這也給不同產(chǎn)業(yè)帶來了不一樣的價值,從技術(shù)到產(chǎn)業(yè)落地的過程已經(jīng)在實踐、在發(fā)展了。
舉個例子,我們現(xiàn)在可以通過計算機視覺幫助制造業(yè)廠商做缺陷檢測,用機器人幫倉儲物流行業(yè)降本增效,用AI的方式讓你提前測試某款化妝品、衣服的上身效果,不用再出門去商場了。
不管是降低成本、提升效率還是增強體驗,在很多場景中,AI都是用這樣的方式來產(chǎn)生價值的。
但是這件事情并沒有大家想象中的那么好。
在AI的熱度之下,其實企業(yè)對AI如何落地、如何使用、如何給自己帶來價值,是沒有那么清楚的,落地的過程也沒那么容易,這也是我一上來講我們做的事情并沒有那么光鮮,反而非常累的原因。
AI落地回歸價值本身
這是Gartner統(tǒng)計的阻礙企業(yè)應用AI的原因,其中包括現(xiàn)有員工缺乏相關的技能、對AI的作用和用途不了解、缺乏數(shù)據(jù)、系統(tǒng)整合起來比較麻煩、場景不清晰、戰(zhàn)略不清晰、隱私安全保護、價值不好衡量……一大堆的問題,其中有幾個問題是比較關鍵的。
首先,我們做一個應用產(chǎn)品,需要盡可能控制成本,不管是算法研發(fā)的成本,還是技術(shù)應用的成本,我們必須要算這個賬。這項技術(shù)/產(chǎn)品地使用帶來的價值增量到底有多大?如果企業(yè)不采用這項技術(shù)/產(chǎn)品,成本相對而言是更低還是更高?你的ROI怎么樣?這是我們必須要回答的問題。
第二,當我們在一個特定場景中落地的時候,需要一個完整的解決方案。如果你的方案不完整,不能幫用戶解決切實的問題,企業(yè)怎么會用起來呢?所以需要明確的落地方案。
第三,需要更多的專業(yè)人員。因為理解技術(shù)和理解場景這兩種知識往往分布在不同的人群,需要兩類專業(yè)人員結(jié)合到一起,才能夠深入到場景當中解決行業(yè)痛點、給客戶帶來真正的價值。
今天我們講AI技術(shù)講了很多,但AI本質(zhì)上只是一個技術(shù)實現(xiàn)手段,最終大家都要回答產(chǎn)品經(jīng)理的靈魂拷問:
你到底應用AI在這個場景給誰創(chuàng)造了什么樣的價值?為什么你能行?為什么是現(xiàn)在?
這是最根本的問題,AI帶來的價值有多大?客戶愿不愿意用?
對于技術(shù)公司來講,我們也需要回答這樣的問題。我們需要從價值創(chuàng)造的角度、從需求側(cè)來看是不是真的解決用戶的痛點,技術(shù)應用能不能成規(guī)模,我們才會選擇做這樣的方向。
反過來講,我們也要考慮技術(shù)能不能滿足這樣的場景。
任何技術(shù),不管是人臉識別還是自動駕駛,都必須回答一個問題:你的技術(shù)成熟嗎?性能足夠解決這些問題嗎?
我認為自動駕駛應該是從低速到高速的發(fā)展路徑,先做低速自動駕駛,再做高速自動駕駛;應該是從受限場景到開放場景;應該是從運貨到運人。因為自動駕駛是一個肩負著極重社會責任責任的應用,價值極其大,最終必將被人類所征服。但是它的技術(shù)也許需要三年、五年,或者十年,甚至更長的時間才能成熟。
自動駕駛是一個價值極其大的場景,自動駕駛必將被人們所征服。
所以我們在思考任何一個場景的時候,都需要回答本質(zhì)問題:
你的價值到底夠不夠大?
技術(shù)能不能滿足用戶需求?
只有這兩點結(jié)合起來,才能夠給這個場景真正地創(chuàng)造價值。
從做錯了也可以補救的場景開始
正是因為AI落地應用有需求側(cè)的問題,有供給側(cè)的技術(shù)問題,所以我們會看到不同的行業(yè)發(fā)展的速度不一樣。有一些場景會相對簡單,有些場景會相對的難。那什么場景更容易發(fā)展起來呢?我們覺得要先從你做錯了也可以補救的場景開始。
舉個例子,比如說我們現(xiàn)在做缺陷檢測。缺陷檢測場景的核心是“寧可錯殺一千,不可放過一個”,錯殺就錯殺了,人工再來一遍就好了,通過人機結(jié)合的方式可以做到一個很好的體驗。
此外在視覺識別的很多場景下,雖然AI只是起到輔助性的作用,但它幫助人提升效率、降低成本,在這些場景下,錯誤是可以補救的。所以雖然這種場景下AI的精度很重要,但它并沒有那么關系重大,還有一定的容錯率。
而在一些成敗攸關的領域,比如自動駕駛,還有我們在做的生產(chǎn)制造、物流,都是一些更偏向主營業(yè)務線上的工具,我們有客戶就提到:“如果你導致我的生產(chǎn)線停產(chǎn)幾分鐘,你就要給我相應的賠償。”
因為任何意外停頓都會給客戶的生產(chǎn)線帶來巨大損失,在這樣事關重大的場景,AI是不能出錯的,否則付出的代價是很大的。
因此我們衡量AI落地領域熱度的坐標系里有兩個軸,一個軸是價值大不大,價值越大,這個領域越熱門;另一個軸是技術(shù)行不行,技術(shù)越好,這個領域就會越熱門。
所以AI可以賦能非常多的行業(yè),但是當下這些行業(yè)還處在發(fā)展周期的不同位置上。
現(xiàn)在是發(fā)展AI特別好的時機,大家都在講AIoT,AI+IoT是特別干柴烈火的場景,因為硬件成本逐漸變得更低,5G讓連接變得更迅捷,在這些基礎之上實現(xiàn)非常好的IoT的連接后,就能夠產(chǎn)生更多數(shù)據(jù),讓AI算法實現(xiàn)快速突破,新技術(shù)也就得到了更好的結(jié)合,能夠被應用到各種場景中。
AIoT的三個角色:感知、決策、執(zhí)行
我分享一下曠視對于AIoT的理解。我們認為整個AIoT體系下有且僅有三種角色,分別叫感知器、決策器、執(zhí)行器。道理其實很簡單,比如人用眼睛和耳朵做感知,用大腦做決策,用手和腳做執(zhí)行,任何一個場景都是這樣的閉環(huán)架構(gòu)。
舉個例子,比如我們有一個產(chǎn)品是人臉識別門禁,就是特別簡單的AIoT場景。感知環(huán)節(jié)是用攝像頭拍人臉;決策環(huán)節(jié)是對人臉進行判斷,如果這個人是公司的員工或訪客,就把門打開;執(zhí)行器就是那個門。這就是非常簡單的場景。
再比如我們給日本客戶做了一個演示,控制很多的機械臂、傳送帶、AGV(自動導引車,有輪子的移動機器人),幫助倉庫、工廠實現(xiàn)自動化。這里面的感知環(huán)節(jié),是有很多的攝像頭對貨物、場景、操作者進行感知,通過IoT的方式收集設備的數(shù)據(jù);決策環(huán)節(jié)就是決定機械臂什么時候該動,小車什么時候去哪個地方接貨物、走什么路徑、送到哪里去;最后是執(zhí)行需要有一個好的硬件載體做執(zhí)行。
感知、決策、執(zhí)行,這是我們做AIoT的框架和邏輯。
AI也好,IoT也好、AIoT最終還是要回到價值,我們到底給什么場景、什么客戶、在什么樣的情形下帶來價值。
價值主要是三個方面:成本優(yōu)化、效率提升、體驗增強。所以我們必須思考如何能夠給客戶帶來這方面的價值。
因此我們判斷一個場景該不該做,也是通過前面這些方式。我們要考慮ROI,要考慮給客戶帶來了什么樣的回報,要看技術(shù)是否成熟,場景是否夠大,如何能實現(xiàn)規(guī)?;?。
現(xiàn)在,任何一個場景中都需要很多算法,比如說視覺識別在工業(yè)場景中的應用,可能需要上千個算法去識別不同的東西。
所以,低成本、大規(guī)模產(chǎn)生算法,是AI賦能得以迅速推廣的關鍵。
那么視覺算法如何低成本實現(xiàn)呢?有沒有批量化生產(chǎn)這些算法的機制?
曠視的解決之道是做了一個底層的算法平臺,叫Brain++。Brain++做的事情就是通過高效的深度學習的平臺,更有效、低成本地生產(chǎn)算法,讓研究員更快生產(chǎn)出他們想要的算法,通過AutoML的方式,針對已經(jīng)規(guī)范好的場景,自動化生成算法。
感知層的算法、決策層的優(yōu)化算法、控制層的控制算法,都可以通過Brain++降低生產(chǎn)成本,也降低了AI應用到一個場景的成本,讓AI落地到更多產(chǎn)業(yè)中去。
基于算法,能夠形成行業(yè)的應用軟件和平臺軟件,比如在不同場景中需要不一樣的應用軟件。那么這些應用軟件是否有好的PaaS層、提供好的共性、提供更低成本的落地方式,關系到整個過程能否實現(xiàn)低成本化,實現(xiàn)貼近使用場景,這是非常關鍵的事情。
曠視在做什么呢?我們基于Brain++算法平臺,深耕三個主要的應用場景。
第一個場景以手機為終端,去賦能手機,讓手機具備識別人臉的能力,具備識別各種信息的能力,能夠刷臉解鎖,能夠把照片變得更漂亮,讓相機變得更智能。
第二個是城市物聯(lián)網(wǎng),以相機為終端,通過分析相機中的數(shù)據(jù),讓城市變得更加的便捷和安全。
最后一個場景是供應鏈物聯(lián)網(wǎng),就是前面講的把機器人、機械臂、AGV等一系列的自動化的設備連接起來,通過視覺的方式提供完整的解決方案,給倉庫、工廠降本增效。
這是我們支持的天貓超市的一個倉庫,大概用了400多臺機器人,來幫助天貓超市完成整個京津冀地區(qū)的發(fā)貨。如果在座的各位在北京去下天貓超市的訂單,很有可能是我們的機器人系統(tǒng)把貨發(fā)給你的。
對于曠視這樣的技術(shù)公司來說,AI的場景其實是有巨大機會的,因為AI作為一個很好的手段,可以給不同的場景帶來不同的價值。
具體怎么去創(chuàng)新呢?放在剛才感知、決策、執(zhí)行的框架下來看,其實每一個環(huán)節(jié)都有創(chuàng)新的機會,都有做出足夠好的差異化產(chǎn)品的機會:
我們可以做出不一樣的傳感器,通過感知算法加上新形態(tài)的傳感設備,實現(xiàn)更好的感知,面向更多感知維度,提高精度,實現(xiàn)更好的集成度。
我們也可以做更好的決策器,這能提供很大的價值,比如解決倉庫里大量機器人的統(tǒng)一調(diào)度、統(tǒng)一運行問題,需要優(yōu)化的算法,需要一個決策器;如何讓收集來的海量數(shù)據(jù)產(chǎn)生對場景有價值的計算方式和業(yè)務模型,這些都是在決策器上可以做創(chuàng)新的點。
在執(zhí)行器上,我們也可以做很多不一樣的執(zhí)行器、不一樣的自動化的裝置、不一樣的設備。AI+IoT對于場景能夠帶來非常多的價值,曠視作為AIoT方向的踐行者,我們最早從感知出發(fā),現(xiàn)在從感知逐漸邁向決策、邁向執(zhí)行,也希望通過這些技術(shù)方式,最終給客戶創(chuàng)造更大的價值。
這就是我們現(xiàn)在在做的事情,謝謝大家。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )