2017年,知識(shí)經(jīng)濟(jì)日益火爆,分答、知乎、得到等知識(shí)平臺(tái)可謂如日中天。眼下這種火爆已在從人類延展到機(jī)器?;ヂ?lián)網(wǎng)巨頭紛紛對(duì)知識(shí)變得饑渴起來,知識(shí)成為數(shù)據(jù)之后的又一個(gè)香餑餑。
互聯(lián)網(wǎng)巨頭對(duì)知識(shí)越來越青睞
兩三年來,互聯(lián)網(wǎng)大佬言必談數(shù)據(jù),特別是大數(shù)據(jù)。曾有人戲稱馬云應(yīng)該叫“Data Ma”,因?yàn)椴欢夹g(shù)的馬云,十分鐘愛談大數(shù)據(jù),馬云的“五新理論”中有一個(gè)是“新能源”,其認(rèn)為未來機(jī)器吃的不是電,而是數(shù)據(jù)。其外,李彥宏、馬化騰等大佬關(guān)于大數(shù)據(jù)都有不少言論,馬化騰說數(shù)據(jù)是AI應(yīng)用的四大要素之一,李彥宏也提到:“由數(shù)據(jù)、算力、算法‘三位一體’共同驅(qū)動(dòng)的人工智能或?qū)⒊蔀橥苿?dòng)經(jīng)濟(jì)增長與時(shí)代進(jìn)步的新引擎?!?/p>
數(shù)據(jù)是AI的基礎(chǔ),也是互聯(lián)網(wǎng)公司的重要資產(chǎn),通過算法挖掘可以形成可觀價(jià)值,是毋庸置疑的。不過,我觀察到,今年互聯(lián)網(wǎng)巨頭們對(duì)于數(shù)據(jù)談得少了,談知識(shí)反而越來越多。
最具代表性的是百度,新春內(nèi)部演講中,李彥宏說,“知識(shí)圖譜(包括需求圖譜、用戶畫像等等),這些東西都是百度整個(gè)人工智能當(dāng)中非常基礎(chǔ)的構(gòu)件,也是我們相對(duì)于其他任何一家公司的優(yōu)勢(shì)所在。”“非?!币辉~足見李彥宏對(duì)于“知識(shí)”的重視。百度總裁兼COO陸奇在今年AI開發(fā)者大會(huì)上則指出,“知識(shí)就是力量,有了知識(shí)我們可以做預(yù)測(cè)、做自動(dòng)化,解決任何重要的問題,人類歷史就是改造世界、認(rèn)識(shí)世界的歷史,AI就是幫助人類認(rèn)識(shí)世界、改造世界的工具,AI是人類歷史上重要的里程碑?!痹跇I(yè)務(wù)層面,百度在知識(shí)上的底層布局就是知識(shí)圖譜。
除了百度谷歌在知識(shí)圖譜上也一直在積極布局。2012年5月,Google就推出了知識(shí)圖譜(Google Knowledge Graph),利用其優(yōu)化搜索結(jié)果。2013年,Google收購自然語言處理技術(shù)公司W(wǎng)avii,將后者技術(shù)與Google Knowledge Graph整合。2015年谷歌推出醫(yī)療版知識(shí)圖譜?,F(xiàn)在谷歌語音搜索、Google Assistant、Google Lens、Google Home諸多軟硬件產(chǎn)品均已接入谷歌知識(shí)圖譜。
不只是百度、谷歌等搜索引擎在知識(shí)圖譜上布局,阿里、華為等玩家也已在部署知識(shí)圖譜,讓自己變得更有知識(shí)。從Data到Knowledge,為什么互聯(lián)網(wǎng)巨頭們青睞的事物會(huì)有這樣的轉(zhuǎn)變?
知識(shí)對(duì)于互聯(lián)網(wǎng)究竟有何價(jià)值?
知識(shí)對(duì)于互聯(lián)網(wǎng)第一層價(jià)值是內(nèi)容或者說信息價(jià)值——就像知乎、分答、百科、知道等等知識(shí)類產(chǎn)品一樣,它們滿足了用戶的知識(shí)生產(chǎn)、共享、獲取等需求。不過,長期來看,知識(shí)對(duì)于互聯(lián)網(wǎng)的價(jià)值主要在于,起到一個(gè)從數(shù)據(jù)到AI的“橋梁”作用,它不可或缺且會(huì)日益重要。
第一,知識(shí)讓機(jī)器具有認(rèn)知能力。
每家互聯(lián)網(wǎng)公司都在強(qiáng)調(diào)自己擁有海量數(shù)據(jù),不過,不同數(shù)據(jù)價(jià)值是截然不同的。從應(yīng)用場(chǎng)景看,搜索數(shù)據(jù)、社交數(shù)據(jù)、電商數(shù)據(jù)、支付數(shù)據(jù)、視頻數(shù)據(jù)等等的價(jià)值可以說大不相同;從數(shù)據(jù)形式看,結(jié)構(gòu)化與非結(jié)構(gòu)化的數(shù)據(jù)價(jià)值不同,前者更可能被機(jī)器利用;從數(shù)據(jù)性質(zhì)看,感知類和知識(shí)類數(shù)據(jù)價(jià)值截然不同,前者是視覺、聲音、運(yùn)動(dòng)等物理感知數(shù)據(jù);后者則是知識(shí)類數(shù)據(jù),“人類對(duì)物質(zhì)世界以及精神世界探索的結(jié)果總和?!敝挥腥祟惒拍墚a(chǎn)生、創(chuàng)作、總結(jié)和理解的數(shù)據(jù),比如支付、搜索、創(chuàng)作、語言等等數(shù)據(jù)。
而知識(shí)類數(shù)據(jù)最核心的價(jià)值在于,可讓機(jī)器形成認(rèn)知能力。百度AIG(人工智能技術(shù)體系)負(fù)責(zé)人王海峰曾提出,AI可以分為感知層和認(rèn)知層,感知是人類和動(dòng)物都有的能力,機(jī)器一定程度也可以比人類更強(qiáng);但認(rèn)知是人類的專屬能力。機(jī)器感知能力目前已趨于成熟(比如百度世界大會(huì)上語音技術(shù)可以實(shí)時(shí)生成字幕,再比如圖像識(shí)別很多時(shí)候比人準(zhǔn)),但認(rèn)知能力還有很大的提升空間。知識(shí)類數(shù)據(jù)可以讓機(jī)器在感知能力的基礎(chǔ)上形成認(rèn)知能力。
第二,知識(shí)可以讓機(jī)器與人類對(duì)話。
我們要機(jī)器成為合作伙伴也好,智能助理也罷,前提就是要能夠與機(jī)器溝通,就是交互。目前我們與機(jī)器的主要交互方式,是反人性的——用輸入法打字即便再簡(jiǎn)單也需要一定的學(xué)習(xí)成本,只有觸摸、語音、視覺這樣的交互方式才是自然的,是小孩子都擁有的能力。
盡管眼下已經(jīng)有語音交互技術(shù)、圖像識(shí)別技術(shù),但整體來說還不夠智能,比如語音無法理解長句子等復(fù)雜句式,再比如圖像識(shí)別更多是對(duì)條形碼等簡(jiǎn)易圖片有效。要機(jī)器實(shí)現(xiàn)與人類的自然對(duì)話,像一個(gè)真正的助理那樣與用戶交互,就需要它儲(chǔ)備足夠多的知識(shí)。有知識(shí)儲(chǔ)備的機(jī)器有了認(rèn)知,就不只是擁有語音或者圖像識(shí)別能力,而是具備語義理解能力,從聽清進(jìn)步到聽懂,從看出來升級(jí)到看得懂。
再舉個(gè)例子,一個(gè)真正的秘書不只是可以識(shí)別主人,還能根據(jù)主人表情揣摩其情緒,進(jìn)而做出響應(yīng)。iPhone X的Face ID目前只能識(shí)別主人的臉,如果有了知識(shí)就可以“讀臉”揣摩主人情緒,比如用戶愁眉苦臉時(shí)可以推薦一首歡快的歌曲。百度世界大會(huì)上李彥宏演示的“火車司機(jī)疲勞識(shí)別”,本質(zhì)上就是在圖像識(shí)別技術(shù)上加載了知識(shí)圖譜后的成果,機(jī)器可以理解“什么表現(xiàn)是疲勞駕駛”。
第三,知識(shí)可以讓機(jī)器智能決策。
如果機(jī)器只有感知能力,本質(zhì)上只是改變數(shù)據(jù)輸入方式——機(jī)器的數(shù)據(jù)輸入自動(dòng)化、無人化、實(shí)時(shí)化,進(jìn)而提高輸入效率、降低人力成本,增加采集場(chǎng)景。然而機(jī)器的本質(zhì)還是傳統(tǒng)意義上的功能計(jì)算機(jī)。就算可以做出決定,本質(zhì)也只是“if this then that”的、在人類設(shè)定的規(guī)則下的按部就班。
然而,當(dāng)機(jī)器通過足夠多的知識(shí)建立認(rèn)知能力,對(duì)世界有自己的理解后,就可以進(jìn)行智能決策。一個(gè)例子是AlphaGo——相對(duì)于深藍(lán)等基于規(guī)則的下棋程序不同,它每一步的走棋,是基于對(duì)圍棋規(guī)則的認(rèn)知以及下贏對(duì)方的目標(biāo)而進(jìn)行的,它是真正意義上的AI下棋。AlphaGo Zero則是進(jìn)階版,它可以不借助任何圍棋棋譜與人類經(jīng)驗(yàn)自我學(xué)習(xí)進(jìn)步,等于說是構(gòu)建了一套自主的知識(shí)體系,它成為知識(shí)的輸出者,棋譜也值得人類棋手去學(xué)習(xí)。當(dāng)然,前提也是有圍棋規(guī)則這個(gè)人類知識(shí)的輸入。
我們不論是招聘秘書,還是聘請(qǐng)管家,都希望找一個(gè)“有一定想法”的,會(huì)主動(dòng)思考和自我決策的人,而不是找一個(gè)讓TA做什么才做什么的人。同樣的道理,要機(jī)器有“一定的想法”,能夠自我決策,變得智能,就必須要有足夠多的知識(shí)輸入,讓其形成認(rèn)知能力。
因此可以看到,在AI時(shí)代,我們要讓機(jī)器真正意義上認(rèn)知這個(gè)世界,要讓機(jī)器與我們更自然地交互,要讓機(jī)器可以智能做出決策,都必須要輸入足夠多的知識(shí)給機(jī)器。如何給機(jī)器輸入知識(shí)?核心技術(shù)就是知識(shí)圖譜,它就像AlphaGo“吃”的棋譜一樣,是將人類掌握的不同知識(shí)進(jìn)行關(guān)聯(lián)存儲(chǔ)于計(jì)算機(jī)中,形成網(wǎng)狀結(jié)構(gòu)并持續(xù)動(dòng)態(tài)完善,讓機(jī)器不斷汲取知識(shí),對(duì)世界的認(rèn)知日益完善。
看到這里就能明白,為什么李彥宏會(huì)說知識(shí)圖譜是百度整個(gè)人工智能非?;A(chǔ)的構(gòu)件了。知識(shí)圖譜對(duì)于人工智能可以說是不可或缺,陸奇說,“AI革命的本質(zhì)是快速的、自動(dòng)地獲取知識(shí)”,王海峰則認(rèn)為知識(shí)圖譜是AI的基石。“如果知識(shí)是人類進(jìn)步的階梯,知識(shí)圖譜就是AI進(jìn)步的階梯”,知識(shí)是AI的基礎(chǔ)已得到行業(yè)共識(shí)——有數(shù)據(jù)的巨頭企業(yè)很多,然而有知識(shí)圖譜技術(shù)的巨頭卻屈指可數(shù)。
知識(shí)圖譜到底有哪些應(yīng)用場(chǎng)景?
說到語音技術(shù),人們就會(huì)想到Siri;說到圖像技術(shù),人們會(huì)想到iPhone X的Face ID;說到知識(shí)圖譜,人們可能會(huì)想到百度搜索結(jié)果右側(cè)的關(guān)聯(lián)內(nèi)容,這是百度2014年便已大規(guī)模應(yīng)用的知識(shí)圖譜產(chǎn)品,3年應(yīng)用量增加了160倍。
不過,知識(shí)圖譜的應(yīng)用場(chǎng)景遠(yuǎn)不止于搜索,它跟自然語言處理技術(shù)一樣更為底層,很多時(shí)候是透明的,許多AI應(yīng)用,背后都在應(yīng)用知識(shí)圖譜技術(shù),目前這些場(chǎng)景最典型:
1、資訊。
資訊行業(yè)正在迎來一場(chǎng)大變革——內(nèi)容創(chuàng)作進(jìn)入自媒體時(shí)代,內(nèi)容分發(fā)信息流日益流行,而信息流的基礎(chǔ)就是個(gè)性化推薦技術(shù)。要做好個(gè)性化推薦技術(shù)只需做好兩點(diǎn):一個(gè)是理解用戶的閱讀興趣;另一個(gè)是理解資訊內(nèi)容。然而兩點(diǎn)要做到都不容易,理解用戶的前提是足夠多的用戶興趣數(shù)據(jù),理解內(nèi)容的前提則是知識(shí)圖譜,平臺(tái)必須要有一定的“認(rèn)知”才知道不同內(nèi)容意味著什么,適合哪些興趣的用戶,而不是簡(jiǎn)單的關(guān)鍵詞匹配。
舉個(gè)例子,一個(gè)文章內(nèi)容是馬云最新演講解讀,是將其推薦給電商行業(yè)人士,還是希望獲得成功的年輕人,還是李彥宏等企業(yè)家們?每個(gè)人都可能感興趣,如何推薦就要結(jié)合對(duì)內(nèi)容的認(rèn)知,以及對(duì)用戶興趣以及當(dāng)前場(chǎng)景的理解,知識(shí)圖譜就派上用場(chǎng)了。特別是在視頻領(lǐng)域,要理解內(nèi)容不是靠文字識(shí)別,而是要靠機(jī)器視覺技術(shù),對(duì)內(nèi)容本身的理解難度更高,知識(shí)圖譜更重要。
現(xiàn)在,今日頭條、百度、一點(diǎn)資訊、搜狐、網(wǎng)易、企鵝、UC、微博等等都在做信息流。百度世界大會(huì)上宣布百度信息流月活超過6億,相比去年5月剛推出時(shí)日均閱讀量提升105倍,短視頻日均播放量提升169倍,這個(gè)成果,與知識(shí)圖譜的優(yōu)勢(shì)密不可分。
2、泛娛樂。
看上去,娛樂與人工智能八竿子打不著關(guān)系,更與知識(shí)圖譜沒什么瓜葛。實(shí)則不然,傳統(tǒng)娛樂或許確實(shí)不需要什么信息技術(shù),然而新娛樂時(shí)代,技術(shù)重要性與日俱增。今年百度世界大會(huì)上,愛奇藝CEO龔宇的演講是讓人印象十分深刻的環(huán)節(jié),徹底顛覆了許多人對(duì)娛樂的認(rèn)知。
愛奇藝通過自制內(nèi)容戰(zhàn)略取得突破,推動(dòng)其會(huì)員模式成功,將于2018年IPO。很少人知道的是愛奇藝一直很強(qiáng)調(diào)對(duì)技術(shù)的應(yīng)用,創(chuàng)作、制造、宣發(fā)、營銷、預(yù)測(cè)等等環(huán)節(jié)都應(yīng)用AI技術(shù)。比如基于機(jī)器學(xué)習(xí)的多時(shí)間窗口預(yù)測(cè)電影票房,提前半年方差準(zhǔn)確率高達(dá)77%;比如《中國有嘻哈》這個(gè)小眾音樂節(jié)目的成功,也得益于愛奇藝對(duì)年輕受眾用戶畫像再采取針對(duì)性措施;再比如愛奇藝可以基于娛樂知識(shí)圖譜來預(yù)測(cè)哪個(gè)藝人會(huì)成為下一個(gè)黑馬。
早在2015年,愛奇藝就建立了“視頻深度學(xué)習(xí)產(chǎn)學(xué)聯(lián)合實(shí)驗(yàn)室”,計(jì)劃通過可視計(jì)算、機(jī)器學(xué)習(xí)、大數(shù)據(jù)挖掘算法和自然語義分析,挖掘人與視頻間的多維關(guān)系,構(gòu)建視頻知識(shí)圖譜和視頻推薦系統(tǒng),提升愛奇藝智能推薦和流量、票房預(yù)測(cè)精度。百度正在輸出AI能力,相信愛奇藝會(huì)與大股東百度有更深層次的合作,特別是視頻知識(shí)圖譜領(lǐng)域,愛奇藝將是一個(gè)絕佳場(chǎng)景。
3、金融。
金融是百度最先商用的AI場(chǎng)景,正如李彥宏所說:“金融的數(shù)據(jù)化本質(zhì),加上業(yè)務(wù)規(guī)則清晰,使它成為人工智能最佳的應(yīng)用場(chǎng)景?!苯鹑诘闹R(shí)相對(duì)垂直,因此也非常適合與知識(shí)圖譜技術(shù)結(jié)合。我記得2015年,百度就已將知識(shí)圖譜應(yīng)用在股票領(lǐng)域,旗下產(chǎn)品股市通通過數(shù)據(jù)、信息與股票的關(guān)系,以及股票與股票之間的關(guān)系,在股票領(lǐng)域首創(chuàng)知識(shí)圖譜,實(shí)現(xiàn)智能選股。不只是百度金融在應(yīng)用知識(shí)圖譜,整個(gè)金融行業(yè)都在將知識(shí)圖譜應(yīng)用在個(gè)人征信、貸款風(fēng)控、保險(xiǎn)銷售、保險(xiǎn)策劃、金融指數(shù)、反欺詐、客戶管理管理、智能客服等領(lǐng)域,出現(xiàn)了不少提供金融AI技術(shù)或者是金融知識(shí)圖譜服務(wù)的創(chuàng)業(yè)公司,百度金融也在積極地推進(jìn)智能金融科技的開放,包括金融知識(shí)圖譜的開放。
4、手機(jī)。
智能手機(jī)2017年最大賣點(diǎn)是全面屏,同時(shí)還有一個(gè)亮點(diǎn)是AI——iPhone X、華為Mate 10等等旗艦機(jī)都有不少AI元素。怎樣的手機(jī)稱得上真正的AI手機(jī)?關(guān)鍵在于智能化功能和智能化能力。智能化功能上除了像FaceID這樣可以識(shí)人外,還要有比Siri更聰明的助理,真正意義上成為用戶的個(gè)人助理,給用戶做決策,這離不開知識(shí)圖譜技術(shù)。智能化能力上就是要在芯片、系統(tǒng)、云端形成AI能力,可以越用越快、安全等等,要實(shí)現(xiàn)這些能力需要手機(jī)領(lǐng)域的知識(shí)圖譜。
可以說,智能手機(jī)要AI化離不開信息/服務(wù)知識(shí)圖譜和手機(jī)知識(shí)圖譜。不過,AI技術(shù)、云服務(wù)以及知識(shí)圖譜技術(shù)都是互聯(lián)網(wǎng)巨頭擅長的事情,是多數(shù)手機(jī)公司的短板。怎么辦?最近百度與小米就AI達(dá)成深度合作,聯(lián)系到此前DuerOS與HTC、vivo等合作來看,百度未來很可能會(huì)給手機(jī)公司提供知識(shí)圖譜技術(shù)助力智能手機(jī)真正“智能”起來。
知識(shí)圖譜的應(yīng)用場(chǎng)景遠(yuǎn)遠(yuǎn)不止這些,它是AI的基石,理論上來說每一個(gè)AI場(chǎng)景都是知識(shí)圖譜的場(chǎng)景,而AI將改變各行各業(yè),其應(yīng)用場(chǎng)景之廣泛可想而知了。截至目前,百度知識(shí)圖譜已經(jīng)應(yīng)用到幾十個(gè)領(lǐng)域,百度知識(shí)圖譜技術(shù)奠基人王海峰曾在一次演講中表示:“人工智能與傳統(tǒng)產(chǎn)業(yè)融合的過程中,要想為這個(gè)行業(yè)提供更好的服務(wù),就需要對(duì)這個(gè)行業(yè)進(jìn)行定制化,要有行業(yè)知識(shí),這時(shí)候就需要在通用知識(shí)圖譜的基礎(chǔ)上,有相應(yīng)的行業(yè)知識(shí)圖譜,進(jìn)而幫助這個(gè)行業(yè)提升生產(chǎn)力,幫助這些行業(yè)、產(chǎn)業(yè)升級(jí)?!睆倪@段話可以看出,百度知識(shí)圖譜也會(huì)開放給更多行業(yè),讓各行各業(yè)吃上知識(shí)圖譜。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。