解開“機(jī)器的因果”:人機(jī)自然交互為何成為阿里AI觀的起點(diǎn)

原標(biāo)題:解開“機(jī)器的因果”:人機(jī)自然交互為何成為阿里AI觀的起點(diǎn)

很快《復(fù)聯(lián)3》會(huì)上映,大伙喜聞樂見的鋼鐵俠又要來了。

圍繞鋼鐵俠,有個(gè)有意思的現(xiàn)象值得我們開開腦洞:應(yīng)該每個(gè)人都想要戰(zhàn)甲里搭載的AI程序“賈維斯”,但所有人都在擔(dān)心會(huì)不會(huì)有一天出現(xiàn)想要?dú)缡澜绲?a href="http://picoinsstore.com/AI_1.html" target="_blank" class="keylink">AI機(jī)器人,奧創(chuàng)。

很多大人物,比如說霍金,都在提醒我們要警惕AI的潛在威脅。但仔細(xì)想想,賈維斯和奧創(chuàng)到底有什么區(qū)別呢?只是單純的善惡之分?可善惡又由誰來分辨?

機(jī)器應(yīng)該用智能服務(wù)人類,但不能有“過分的智能”,堪稱AI領(lǐng)域的“先有雞還是先有蛋”問題。

或許可以切換到另一種思路去思考這件事:賈維斯之所以讓人喜歡,是因?yàn)樗茏x懂和理解鋼鐵俠的各種需求,令主動(dòng)提供服務(wù)。也許我們?cè)谛牡灼诖?,只是機(jī)器可以與人進(jìn)行無成本的溝通與理解,而不是要擁有獨(dú)立的人格與智慧。

這樣的邏輯下,AI服務(wù)于人類的基本價(jià)值就落到了那個(gè)既復(fù)雜又簡(jiǎn)單的名詞上:人機(jī)交互。

今天我們來探討這個(gè)問題,是因?yàn)閯倓偳迦A大學(xué)與阿里巴巴宣布達(dá)成戰(zhàn)略合作,共同成立清華大學(xué)- 阿里巴巴自然交互體驗(yàn)聯(lián)合實(shí)驗(yàn)室。這個(gè)實(shí)驗(yàn)室的目的在于探索“下一代人機(jī)交互”的未來。

據(jù)悉,雙方將以“人”為中心,探索“人-機(jī)器-環(huán)境”之間的關(guān)系,讓機(jī)器以更自然的方式與人類互動(dòng)、服務(wù)人類。

跟眾多企業(yè)與大學(xué)聯(lián)合設(shè)立的實(shí)驗(yàn)室相比,清華大學(xué)- 阿里巴巴自然交互體驗(yàn)聯(lián)合實(shí)驗(yàn)室的獨(dú)特之處在于,它專注于解決一個(gè)十分急迫的問題。這個(gè)問題涉及廣闊的產(chǎn)業(yè)與市場(chǎng)可能,甚至關(guān)乎于馬云所說要讓“機(jī)器更像機(jī)器,人更像人”的AI價(jià)值觀。

讓我們先從自然交互今天面臨的一些問題說起。

“五感”合一:人機(jī)交互的拐角在何處?

在智能音箱“狂轟濫炸”過之后,或許很多人認(rèn)為,今天的AI帶來的自然交互能力已經(jīng)相當(dāng)成熟。但事實(shí)上,大伙可能還是有點(diǎn)樂觀了。

當(dāng)然,AI帶來的語音識(shí)別、語義理解、NLP解決方案,以及花樣繁多的傳感與機(jī)器視覺技術(shù),正在打開人機(jī)交互的新腦洞:過去只能通過鍵盤、鼠標(biāo)、觸屏進(jìn)行命令輸入的機(jī)器,正在開始以自然方式與人溝通。

比如我們已經(jīng)可以語音控制音箱、電視和家居,人臉識(shí)別裝置也開始普及到生活當(dāng)中。

但這還遠(yuǎn)遠(yuǎn)不夠?;叵胍幌?,為什么我們有時(shí)候打字說不明白的事,就想要電話溝通?有時(shí)候電話溝通也不行,必須當(dāng)面談?wù)劜趴梢裕?/p>

這是因?yàn)椋伺c人之間的交互是相當(dāng)復(fù)雜的。不僅僅是語言在起作用,音色音調(diào)、表情、肢體動(dòng)作,甚至一個(gè)人隱含的情緒、氣勢(shì),都是人們之間進(jìn)行自然交互的一部分。

但很顯然,今天的AI還做不到這點(diǎn)。

舉個(gè)例子,今天搭載語音交互的空調(diào)開始成為新時(shí)尚。用語音操縱空調(diào)當(dāng)然相比遙控器方便了很多,但也無非就是換了一種遙控方式而已。消費(fèi)者獲得的實(shí)質(zhì)價(jià)值并沒有提升。但如果空調(diào)不僅能聽懂你,還可以看到全家人的位置、穿了多少衣服,還可以感知到屋子里的溫度、濕度,甚至每一個(gè)用戶的體表溫度。那么空調(diào)就可以自主分析制冷模式,給每個(gè)人提供最適合的降溫方案。畢竟空調(diào)病或者冷氣吹太多導(dǎo)致的感冒,發(fā)生幾率將大大降低。

這就是給機(jī)器加上“五感”,進(jìn)行多模態(tài)綜合感知的魅力——機(jī)器不僅是接受遙控的一方,它可以主動(dòng)理解人類,通過智能運(yùn)算得出更好的主動(dòng)服務(wù)方案。

此外,目前AI在處理自然交互的時(shí)候,完全依托于計(jì)算機(jī)科學(xué)的知識(shí)系統(tǒng)。這就導(dǎo)致其會(huì)忽視人類在情緒、心理甚至隱喻層面的表達(dá)需求——聽起來好像有點(diǎn)太難為人家機(jī)器了,但是沒辦法,精益求精嘛……

再舉個(gè)例子,人的語言中是帶著各種情緒的。雖然說一樣的話,但附帶的情感可能完全不同。我們回家讓音箱放一首歌,可能是因?yàn)槲覀兎浅i_心想要來點(diǎn)助興的音樂,也可能是有事不順心,想要安慰一下自己。

假如機(jī)器可以聽出來人類語言中附帶的情緒,可以觀察到用戶是低沉還是興奮。那么給出的服務(wù)將完全不同,一句來自機(jī)器的問候下,可能很多讓人不開心的事都煙消云散了。

模態(tài)綜合與心理解讀,就像這兩座大山一樣橫亙?cè)贏I自然交互的家門口,他們是問題,同時(shí)也是拐點(diǎn)和機(jī)會(huì)。而此次阿里與清華的合作,核心訴求正是要搬走這兩尊山神。

在探索“下一代人機(jī)交互”的路上,清華與阿里巴巴將在情感認(rèn)知計(jì)算、實(shí)體交互、多通道感知等領(lǐng)域開展研究,不但要讓讓機(jī)器具備聽覺、視覺、觸覺等綜合性的“五感”,還要加強(qiáng)其識(shí)別理解人類情感的能力。

假如能通識(shí)五感,理解情緒的自然交互方式出現(xiàn),機(jī)器智能將開啟的,絕不僅僅是一扇大門。

被忽略的商業(yè)價(jià)值:“五新”增長(zhǎng)元點(diǎn)藏于萬物智能

去年年底的時(shí)候,我們報(bào)道過阿里巴巴十二位科學(xué)家對(duì)今年科技走勢(shì)的預(yù)測(cè)。其中科學(xué)家們有一點(diǎn)共識(shí)非常值得注意:語音、視覺、傳感連接為一體的多模態(tài)機(jī)器交互技術(shù),將在今年催生萬物智能的爆發(fā)。

幾天之前,阿里在深圳云棲大會(huì)上宣布,IoT將成為繼電商、金融、物流、云計(jì)算之后的第五條主賽道。顯然從產(chǎn)業(yè)層面印證了科學(xué)家們對(duì)今年的判斷。

這或許說明了,新一代的人機(jī)交互并不只是停留在實(shí)驗(yàn)室里。而是正在以高調(diào)姿態(tài)走入產(chǎn)業(yè)世界,甚至成為“五新”戰(zhàn)略的重要支點(diǎn)。

舉個(gè)簡(jiǎn)單的例子,我們就能看到多模態(tài)的自然交互在實(shí)際生活中多么重要。阿里有一個(gè)在地鐵站進(jìn)行語音識(shí)別購票的案例。其要解決的核心問題是地鐵站中環(huán)境嘈雜,要準(zhǔn)確識(shí)別到購票者語音很不容易。這就要求機(jī)器除了進(jìn)行語音交互,擁有優(yōu)質(zhì)的聲紋識(shí)別、降噪算法之外,還需要進(jìn)一步確認(rèn)買票人。阿里的解決方案是在售票機(jī)前加入人臉識(shí)別裝置,通過人臉和唇形識(shí)別來判斷究竟是誰在買票。

顯然,結(jié)合了語音交互和機(jī)器視覺、人臉識(shí)別的機(jī)器智能,很簡(jiǎn)單就解決了一個(gè)生活中極重要的問題,而這個(gè)問題似乎又無法用其他方式來解決。事實(shí)上,新零售、新制造、新金融的世界中,近乎有無數(shù)場(chǎng)景等待著多模態(tài)交互的機(jī)器智能去攻破。

因?yàn)榻Y(jié)合了語音、視覺、傳感,甚至機(jī)器嗅覺和機(jī)器觸覺的IoT設(shè)備,可以無限接近真人來為用戶提供服務(wù)。在零售和金融服務(wù)中,高效的多模態(tài)交互結(jié)合綜合計(jì)算、智能推薦技術(shù),可以極大提高服務(wù)效率與商業(yè)精準(zhǔn)度。

而制造業(yè)中讓機(jī)器與人類多模態(tài)交互,達(dá)到機(jī)器像人體一樣聽話,那么工業(yè)效率的提升近乎是難以估計(jì)的。家庭、駕駛、城市服務(wù)等場(chǎng)景中,如是案例更是不勝枚舉。

“五新”想要由舊變新,那么萬物智能似乎是不可替代的支撐點(diǎn)。在阿里選擇與清華共同研發(fā)下一代人機(jī)交互的時(shí)候,一盤新的商業(yè)增長(zhǎng)棋局似乎也被阿里帶到了我們面前。

機(jī)器的因果:我們到底需要AI做什么?

更進(jìn)一步說,自然交互的價(jià)值也不僅僅在于商業(yè)世界。就像文章開頭中描述的那樣,人類最初對(duì)AI的恐懼與擔(dān)憂,是縈繞在AI發(fā)展過程中永恒的達(dá)摩克利斯之劍。

到底如何達(dá)成消解恐懼與技術(shù)突破的雙贏呢?從率先開展的自然交互進(jìn)擊中,我們似乎能讀到一絲阿里的技術(shù)觀:以人為本,馴服技術(shù),讓機(jī)器始終是機(jī)器。

或許我們經(jīng)常會(huì)聯(lián)想到AI的失控,是因?yàn)楹芏嘌芯慷际且约夹g(shù)為中心。那么隨著技術(shù)的一點(diǎn)點(diǎn)拓展,很多問題也隨之而來:機(jī)器道德、黑箱難題、數(shù)據(jù)災(zāi)難,等等。而假如我們以“人到底需要AI和機(jī)器來做什么”為出發(fā)點(diǎn),或許就會(huì)發(fā)現(xiàn)整個(gè)技術(shù)邏輯在變得不同。

馬云說“過去三十年我們讓人像機(jī)器,接下來三十年我們讓機(jī)器像人。但歸根結(jié)底要讓人更像人,機(jī)器更像機(jī)器”,其中隱藏的就是阿里技術(shù)邏輯的出發(fā)點(diǎn)和歸途。

交互升級(jí),是人類與機(jī)器相處的本源命題,從杠桿、軸承、開關(guān),到鍵盤、鼠標(biāo)、觸屏,交互在一步步向人類舒服的姿勢(shì)靠攏。而接下來,語言、手勢(shì)甚至表情,當(dāng)然是我們控制機(jī)器的更合理方式。

這條路上我們最終得到的,是能更好服務(wù)人類的機(jī)器,而不是人類無法理解的機(jī)器。這是一種我們很少去思考的AI觀:但假如我們認(rèn)真思考一下到底發(fā)展AI、探索AI是為了什么,或許答案其實(shí)很簡(jiǎn)單:為了讓人類過的更好。

只要永遠(yuǎn)以人為本,機(jī)器的因果問題也就迎刃而解?;蛟S這種技術(shù)信仰會(huì)讓少部分科幻和陰謀論愛好者失望,但對(duì)于絕大多數(shù)人類來說,這是不需要選擇的選擇——機(jī)器會(huì)理解我們,并且我們不需要擔(dān)心ta。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-04-03
解開“機(jī)器的因果”:人機(jī)自然交互為何成為阿里AI觀的起點(diǎn)
原標(biāo)題:解開“機(jī)器的因果”:人機(jī)自然交互為何成為阿里AI觀的起點(diǎn)很快《復(fù)聯(lián)3》會(huì)上映,大伙喜聞樂見的鋼鐵俠又要來了。

長(zhǎng)按掃碼 閱讀全文